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Vorwort 


Wenn von lesebezogenen Prozess- und Produktperspektiven ausgehend von 
der Wortebene bis zu multiplen Texten im Titel dieses Bandes die Rede ist, 
dann ist damit ein weit gefasstes Spektrum angesprochen. Dieses Spektrum 
umfasst nicht nur die klassischen Unterscheidungen dessen, worin sich kom- 
petentes Lesen manifestiert, nämlich im Ergebnis oder auf dem Weg dorthin, 
also im Produkt oder im Prozess. Vielmehr ist mit diesem Kontinuum von 
einzelnen Wörtern bis hin zu mehreren Texten auch die Textmenge angespro- 
chen, die wir im Alltag lesen. Zudem deutet sich darin ein Erwerbshorizont an, 
der vom Schriftspracherwerb bis zu den Anforderungen in der Hochschule 
reicht. 

In diesem Band folgen wir diesem Kontinuum, indem wir sechs Beiträge zu- 
sammengestellt haben, die mehrheitlich aus dem Umfeld des 2020er Sympo- 
sions Deutschdidaktik stammen. Diese Beiträge befassen sich mit dem Kon- 
strukt Lesekompetenz, dessen Hierarchieebenen, seiner Förderung und seiner 
Entwicklung. Sie tun dies bei verschiedenen Altersgruppen aus empirischer und 
theoretischer Perspektive und sie werfen verschiedene Schlaglichter auf Pro- 
zesse und Produkte. So geben die Beiträge dieses Bandes Antwort auf Fragen 
wie: 


e Welche grundsätzlich beschreibbaren Prozesse umfasst Lesekompetenz aus 
kognitiver Perspektive? (Kap. 1, Jambor-Fahlen & Philipp) 

e In welchem Verhältnis steht die Entwicklung von Leseverstehen und Wort- 
schatz? (Kap. 2, Juska-Bacher, Zangger & Röthlisberger) 

e Wie müssen Leseflüssigkeitstrainings beschaffen sein, damit sie möglichst 
wirksam werden? (Kap. 3, Ehlert & Souvignier) 

e Was lehrt eine pandemisch begründete Adaption über die essenziellen, 
kompetenzsteigernden Merkmale von Lesestrategietrainings? (Kap. 4, Wild, 
Kraus, Steinert, Hilbert & Schilcher) 

e Welche Schwierigkeiten haben Studierende beim Verfassen von Diskurs- 
synthesen in puncto erbrachter Leseleistungen? (Kap. 5, Rickert & Philipp) 

e Welche Effekte haben verschiedene Schreibaufträge auf Verstehensleistun- 
gen beim Schreiben über multiple Texte? (Kap. 6, Philipp) 


Dass dieser Band in der vorliegenden Fassung entstehen konnte, verdanken wir 
nicht nur den Beiträgerinnen und Beiträgern, die sich an einen engen Zeitplan 


gehalten haben. Auch dem Beltz-Juventa-Verlag danken wir, ebenso der Pada- 
gogischen Hochschule Zürich für die Finanzierung der Open-Access-Publika- 
tion und Anna Gold für ihre Durchsicht der Beiträge. 


Zürich und Köln, im Juni 2021 
Maik Philipp und Simone Jambor-Fahlen 


Prozess- und Produktperspektiven 
des Lesens von der Wortebene bis zu 
multiplen Texten 


Simone Jambor-Fahlen & Maik Philipp 


Zusammenfassung: Lesekompetenz ist ein mehrdimensionales Konstrukt, das im 
Wesentlichen hierarchieniedrige sowie hierarchiehohe Lesefahigkeiten umfasst. Im 
Beitrag wird zunächst eine Synopse aufeinander aufbauender Lesefähigkeiten bei der 
Lesekompetenz in empirischen (Bildungs-)Studien skizziert. Es wird deutlich, dass sie 
ein Kontinuum abbilden, das von elementaren Lesefähigkeiten über das sinnentneh- 
mende Lesen bis hin zum überwiegend reflektierenden und bewertenden Lesen reicht. 
Zunehmende Kompetenz ist einerseits durch eine Steigerung der Textmenge ge- 
kennzeichnet und andererseits durch ein zunehmend evaluatives und interpretatives 
Lesen. Der Beitrag legt dabei seine Schwerpunkte auf die Beschreibung der Kontinu- 
umsenden, indem er die Leseflüssigkeit auf der einen Seite und das Lesen und Verar- 
beiten multipler Texte auf der anderen Seite fokussiert. Vor diesem Hintergrund argu- 
mentiert der Beitrag abschließend offene Forschungsfragen, die trotz der tradierten 
Forschung in diesem Bereich noch immer Desiderate darstellen. 


Schlüsselwörter: Leseverstehen, Leseflüssigkeit, Lesestrategien, Leseprozesse, Lese- 
kompetenz 


Abstract: Reading literacy is a multidimensional construct that essentially comprises 
lower-order as well as higher-order reading skills. In this paper, we first outline a syn- 
opsis of successive reading skills in reading literacy in empirical (educational) studies. 
It becomes obvious that they represent a continuum ranging from basic reading skills 
to meaning making to predominantly reflective and evaluative reading. Expanding 
competence is characterized by an increase in the amount of text and by increasingly 
evaluative and interpretative reading behavior. The chapter focuses on the description 
of the continuum ends by focusing on reading fluency on the one hand and reading and 
processing multiple texts on the other hand. Against this background, the paper con- 
cludes by arguing open research questions that still represent desiderata despite the 
research in this area. 


Keywords: reading comprehension, reading fluency, reading strategies, reading pro- 
cesses, reading literacy 


1 Einleitung 


Lesen ist eine unverzichtbare Voraussetzung für die Teilhabe an Bildung, denn 
das Lesen ermöglicht durch die Nutzung von Texten fachübergreifend einen 
selbstständigen Wissenserwerb. Der Wissenserwerb ist gefährdet, wenn Lese- 
rinnen und Leser nicht sinnentnehmend lesen können: Texte, die nicht verstan- 
den werden, bleiben bedeutungslos. Dass dieser Umstand nach wie vor relevant 
für das Bildungssystem ist, zeigen die in regelmäßigen Abständen durchgeführ- 
ten nationalen wie internationalen Bildungsstudien. So verlässt beispielsweise 
in Deutschland jede sechste Schülerin und jeder sechste Schüler die Grund- 
schule, ohne über ausreichende Lesefähigkeiten zu verfügen (Hußmann et al., 
2017). 

Die Forschung hat sich dementsprechend vermehrt der Frage nach einer 
wirkungsvollen Leseförderung zugewandt und dabei zunehmend die hierar- 
chieniedrigen (Automatisierung des Wort- und Satzlesens) und die hierarchie- 
hohen (strategiebezogenen) Lesefähigkeiten in den Blick genommen. Leseför- 
dermaßnahmen wie Lautlese-Tandems oder Strategieprogramme gelten als gut 
erforscht und wirkungsvoll (Philipp, 2013) und die Deutschdidaktik läuft 
Gefahr, sich einem Grundsättigungsgefühl hinzugeben. Ist das Forschungsfeld 
«Lesekompetenz» gesättigt? Wissen wir nun grundsätzlich, was zu tun ist, und 
die Schulpraxis muss es nur noch umsetzen? 

Im vorliegenden Beitrag werden wir das Forschungsfeld beleuchten und 
tradierte wie neuere Aspekte des mehrdimensionalen Konstrukts Lesekompe- 
tenz darstellen. Zunächst werden wir anhand einer Synopse von Modellierun- 
gen zur Lesekompetenz in Bildungsstudien zeigen, dass diese ein Spektrum 
abbilden, das von basalen Lesefähigkeiten über das sinnentnehmende Lesen bis 
hin zum Lesen multipler Texte mit komplexen Inferenzbildungen und Inter- 
pretationen reicht. Dabei wird jedoch deutlich, dass die basalen Lesefähigkeiten 
nur partiell - nämlich bei PISA - Eingang in das Konstrukt Lesekompetenz 
finden. Fokussiert wird in den Bildungsstudien vor allem das Verstehen von 
Satz- und Textbedeutungen. Um zu verdeutlichen, dass die Lesekompetenz 
keinen produktbezogenen Ist-Zustand abbildet, sondern ihr vielmehr eine Er- 
werbsfolge im Sinne zunehmender Kompetenz inhärent ist, legt der Beitrag 
einen Schwerpunkt auf den Beginn des Lesenlernens, hier vor allem auf die 
basalen Prozesse des Dekodierens und Automatisierens, um dann das Konti- 
nuum weiter aufzuspannen und den Nutzen und den Einsatz von Lesestrate- 
gien bis hin zum Verstehen und Verarbeiten multipler Texte darzustellen. Da- 
bei wird abschließend deutlich, dass die Forschung zur Lesekompetenz zwar 
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einerseits insbesondere im englischsprachigen, aber auch im deutschsprachigen 
Raum etabliert ist und wir bereits viele Antworten kennen, es aber gute Argu- 
mente dafür gibt, das Forschungsfeld noch nicht als ausreichend beforscht 
anzusehen, sondern neue Herausforderungen zu erkennen und ihnen pro aktiv 
zu begegnen. 


2 Lesekompetenz - produktbezogene Modellierungen 
des Konstrukts in Bildungsstudien 


2.1 Lesekompetenz: Definition und Logik der empirischen 
Kompetenzstufen 


In regelmäßigen zeitlichen Abständen werden die sprachlichen, mathemati- 
schen und naturwissenschaftlichen Leistungen von Schülerinnen und Schülern 
in Bildungsstudien überprüft. So vergleichen etwa PISA (Programme for Inter- 
national Student Assessment, OECD, 2019) und IGLU (Internationale Grund- 
schul-Lese-Untersuchung, Hußmann et al., 2017) die Kompetenzen von Schü- 
lerinnen und Schülern auf internationaler Ebene, während die IQB-Bildungs- 
trends (Stanat et al., 2017; vormals Ländervergleiche) die Schulleistungen in- 
nerhalb Deutschlands miteinander vergleichen. Im Gegensatz zur PISA-Studie, 
die die Kompetenzen von 15-Jahrigen untersucht, erfassen IGLU und der aktu- 
elle IQB-Bildungstrend die Lese- und Schreibleistungen von Viertklasslern. Fiir 
die Sekundarstufe erfasste der IQB-Bildungstrend zuletzt 2015 die Lesekompe- 
tenz von Schülerinnen und Schülern der 9. Klassen (Stanat et al., 2016). Die 
zugrundeliegenden Definitionen der Lesekompetenz in den verschiedenen 
Bildungsstudien ähneln sich naturgemäß. Lesekompetenz wird übergreifend als 
Spektrum von Fähigkeiten verstanden, die es den Leserinnen und Lesern ermög- 
lichen, kontinuierliche sowie diskontinuierliche Texte zu verstehen, zu nutzen 
und über deren Inhalte zu reflektieren. 

Um die Leseleistungen der Schülerinnen und Schüler interpretieren und 
(international) vergleichbar machen zu können, werden die erreichten Punkt- 
werte Kompetenzstufen zugeordnet. Kompetenzstufen bilden Intervalle auf 
einer kontinuierlichen metrischen Skala von Leistungspunkten ab. Diese Inter- 
valle entsprechen jeweils einer definierten Spanne von Punkten. In PISA 2018 
bspw. wird die Lesekompetenz auf acht Kompetenzstufen dargestellt, wobei 
jede Stufe etwa 80 Punkte umfasst (OECD, 2019). Jede Kompetenzstufe ist 
ausführlich beschrieben, sodass sie eine qualitative Interpretation von Punkt- 
werten ermöglicht und so die Rückbindung an die realen Leistungen von 
Schülerinnen und Schülern gewährleistet. 

Die Kompetenzstufen der o.g. Bildungsstudien sind im Vergleich mehr 
oder weniger ausdifferenziert. Inhaltlich ähneln sich die kategorialen Beschrei- 
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bungen, diese werden jedoch jeweils gröber (fünf Kompetenzstufen) oder feiner 
(acht Kompetenzstufen) gefasst. Die Kompetenzstufen beruhen auf empirisch 
gewonnenen Daten zu den Lösungshäufigkeiten der Aufgaben und einer theo- 
retisch ausgearbeiteten graduellen Beschreibung von Fähigkeitsniveaus, die in 
den Bildungsstudien unterschiedlich generiert und modelliert werden. Bei PISA 
(OECD, 2019) orientiert sich das Kompetenzniveau der Schülerinnen und 
Schüler an den Aufgaben, die sie gelöst haben. Das heißt, dass in PISA zum 
einen der Schwierigkeitsgrad der Aufgaben und zum anderen auch das Kom- 
petenzniveau der Leserinnen und Leser auf Basis von Item-Response-Theorien 
dargestellt werden. In den IQB-Bildungstrends werden anhand von empirisch 
gewonnenen Daten Skalen definiert, die in Anlehnung an die von der KMK 
verabschiedeten Bildungsstandards (KMK, 2004) die Kompetenzstufen bilden. 
Auch in der IGLU Studie von 2016 (Hußmann et al., 2017) werden die Kom- 
petenzstufen aufgrund von Schülerfähigkeiten und Aufgabenschwierigkeiten 
gebildet: Die Leseleistungen werden hier auf einer Skala abgebildet, die in gleich 
große Intervalle eingeteilt wurde, sodass fünf Kompetenzstufen entstehen. 

Eine Modellierung von Lesekompetenz aufgrund von Kompetenzstufenmo- 
dellen ist demnach in den Bildungsstudien das Ergebnis einer punktuellen 
Leistungserfassung und kann aufgrund der zyklischen Testung verschiedener, 
aber zum Zeitpunkt der Messung gleichaltriger Personen keine Leistungsent- 
wicklung von Individuen oder Gruppen abbilden. Im Folgenden werden die in 
den Bildungsstudien dargelegten Kompetenzstufen näher erläutert, um an- 
schließend ein mögliches gemeinsames Muster zu extrahieren. 


2.2 Drei Beispiele und eine Synopse 
2.2.1 IQB-Bildungstrends 


In den IQB-Bildungstrends für die Primar- sowie für die Sekundarstufe (Stanat 
et al., 2016; Stanat et al., 2017) werden fünf Kompetenzstufen unterschieden. 
Während auf dem ersten Fähigkeitsniveau explizite Einzelinformationen, die 
sich an leicht auffindbaren Stellen im Text befinden, gewonnen werden kön- 
nen, ist die folgende Kompetenzstufe 2 dadurch gekennzeichnet, dass benach- 
barte Informationen miteinander verknüpft werden können, die weniger expli- 
zit sind. Auf Kompetenzstufe 2 sind die Texte - insbesondere in den Testungen 
für die Sekundarstufe - strukturell komplexer und länger. Auf diesem Fähig- 
keitsniveau sind die Schülerinnen und Schüler in der Lage, Informationen auf- 
grund von Schlussfolgerungen miteinander zu verknüpfen (Inferenzen, 
s. Teilkap. 3.2.3). So können die Leserinnen und Leser einfache kausale Zu- 
sammenhänge oder Motive von handelnden Personen identifizieren. Auf Kom- 
petenzstufe 3 verfügen die Schülerinnen und Schüler über erweiterte Fähigkei- 
ten im Lesen: Auf dieser Stufe können sie Informationen miteinander ver- 
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knüpfen, die über den Text verstreut sind, indem sie eigene Inferenzen bilden. 
Für die Sekundarstufe werden hier Aufgaben angeboten, die sich zum Teil auch 
auf diskontinuierliche Texte, die bspw. Diagramme enthalten, beziehen. Im 
Unterschied zu Kompetenzstufe 2 können die Schülerinnen und Schüler hier 
den Text weitestgehend als Ganzes erfassen und verstehen. Auf Kompetenz- 
stufe 4 verstehen die Schülerinnen und Schüler Texte, die inhaltlich schwieriger 
und strukturell komplexer sind. Auf diesem Fähigkeitsniveau können Leserin- 
nen und Leser wesentliche Aspekte eines Textes identifizieren, indem sie zen- 
trale Aussagen aus Textpassagen miteinander in Beziehung setzen. Dabei sind 
zur Herstellung von Kohärenz eigene Schlüsse zu ziehen. Auf dieser Stufe kön- 
nen die Personen nicht nur Zusammenhänge erkennen, sondern darüber hin- 
aus auch über die Textgestaltung reflektieren. Auf Kompetenzstufe 5 können 
die Schülerinnen und Schüler überwiegend reflektiert lesen, komplexe 
Schlussfolgerungen ziehen und unter Einbeziehung ihres eigenen Vorwissens 
zentrale Aussagen des Textes bewerten. Leserinnen und Leser auf diesem Fä- 
higkeitsniveau können im Text formulierte Behauptungen reflektierend be- 
gründen. Schülerinnen und Schüler auf dieser Kompetenzstufe zeigen zudem 
ein umfassendes und detailliertes Textverständnis, das sie dazu befähigt, As- 
pekte des Textes zu interpretieren und eigene Bewertungsansätze zu formulie- 
ren. 


2.2.2 IGLU 


Auch IGLU 2016 definiert fünf Kompetenzstufen für die Beschreibung der 
Lesefähigkeiten von Kindern in der 4. Klasse. Anders als die IQB-Bildungs- 
trends beginnt hier aber die Beschreibung der Fähigkeitsniveaus auf der Ebene 
des rudimentären Leseverständnisses. So wurden im Rahmen von IGLU 2016 
(Deutschland) zur Erfassung der basalen Lesefähigkeiten zusätzlich zu den 
vorgegebenen Testaufgaben zwei Untertests des ELFE-Lesekompetenztest 
(ELFE II, Lenhard et al., 2017) eingesetzt. Der ELFE II dient der Erfassung der 
Leseflüssigkeit, der Lesegenauigkeit und des Leseverständnisses auf Wort-, Satz- 
und Textebene. Für IGLU 2016 wurden lediglich die Untertests für das Wort- 
und Satzlesen genutzt. So war es möglich, die Leseleistungen von Schülerinnen 
und Schülern zu erfassen, die im Rahmen des IGLU-Lesemodells nicht be- 
schreibbar waren, da sie unterhalb der Schwelle von 390 bis 410 Punkten lagen. 
Die Definitionen der weiteren Kompetenzstufen ähneln denen der oben be- 
schriebenen IQB-Bildungstrends. 


2.2.3 PISA 


Erstmals wurde im Jahr 2018 die PISA-Studie (in den meisten Ländern) digital 
durchgeführt, um dem sich verändernden Leseverhalten von Jugendlichen 
Rechnung zu tragen. Insbesondere die technischen Entwicklungen haben zu 
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neuen Lesegewohnheiten geführt, die auch das Lesen am Smartphone oder 
Bildschirm beinhalten. Die Aufgabenformate umfassen daher ein breites Spek- 
trum an Texten: kontinuierliche Texte und diskontinuierliche Texte, die Ta- 
bellen, Grafiken und Abbildungen enthalten können, sowie multiple Texte, die 
auch Texte aus Internetforen inkludieren. 

So wurden in PISA 2018 acht Kompetenzstufen unterschieden, wobei die 
erste Stufe in drei Substufen 1a, 1b und Ic aufgeteilt ist. Damit ist die Skalierung 
bei PISA differenzierter als in den oben beschriebenen Bildungsstudien. Im Jahr 
2018 wurde erstmals die Leseflüssigkeit der Schülerinnen und Schüler evaluiert. 
Hierzu wurden Sätze vorgegeben, die inhaltlich richtig oder falsch waren und 
von den Schülerinnen und Schülern in einer definierten Zeit als richtig oder 
falsch bewertet werden mussten. Diese Leseleistung wird Stufe 1c zugeordnet; 
die Stufen 1b und la werden zunehmend schwieriger: Während Leserinnen 
und Leser auf Stufe 1b offensichtliche und explizite Informationen finden kön- 
nen, können sie auf Stufe la bereits mehrere benachbarte Informationen mit- 
einander in Beziehung setzen und sogar das Hauptthema eines Textes oder die 
Absicht des Autors erkennen. Auf Stufe 2 können die Schülerinnen und Schüler 
durch Schlussfolgerungen Textzusammenhänge erkennen, auch wenn die In- 
formationen nicht unmittelbar ersichtlich sind. Auf Stufe 3 ist es den Leserin- 
nen und Lesern möglich, über Texte oder eine kleine Zusammenstellung von 
Texten zu reflektieren und Informationen zu interpretieren, die explizit auf- 
findbar sind. In den weiteren Stufen 4 bis 6 werden die angebotenen Texte bzw. 
Textsammlungen zunehmend abstrakter. Jugendliche auf diesen Stufen können 
Informationen, die für die Aufgabenstellung relevant sind, gewichten und kri- 
tisch beurteilen. Die Leserinnen und Leser auf Stufe 6 sind in der Lage, lange 
und abstrakte Texte zu verstehen und tief eingebettete Informationen zu ent- 
nehmen. Texte dieser Stufe können widersprüchliche Perspektiven und Infor- 
mationen enthalten, die von den Leserinnen und Lesern reflektiert und bewer- 
tet werden müssen, um zu einer richtigen Beantwortung der Fragestellungen zu 
gelangen. 


2.2.4 Synopse 


Den hier beschriebenen drei Modellierungen von Lesekompetenz ist gemein- 
sam, dass sie ein Spektrum abbilden, das von elementaren Lesefähigkeiten über 
das Verknüpfen von Informationen, also dem sinnentnehmenden Lesen bis hin 
zum überwiegend reflektierenden Lesen mit komplexen Inferenzbildungen und 
Interpretationen reicht. Übergreifendes Merkmal dieser Modellierungen von 
Lesekompetenz ist demnach, die propositionale Struktur von Texten besser zu 
erkennen und zu verarbeiten. Zunehmende Kompetenz ist dadurch gekenn- 
zeichnet, ein evaluatives, teils kritisches Lesen zu bemühen, um dadurch die 
aufgabenspezifischen Anforderungen zu erfüllen. Hinzu kommen Aspekte der 
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Leseflüssigkeit, die aber nur in bestimmten Modellen salient ist, sonst aber als 
Bestandteil vorausgesetzt wird. Zudem werden, wie in Abbildung 1 dargestellt, 
der Textumfang größer sowie die Struktur der Texte komplexer und die Inhalte 
abstrakter. Bei der Bedeutungserschließung entfernen sich die beschriebenen 
Kompetenzstufen immer weiter von der Textoberfläche, sodass sich das Lese- 
kompetenzkontinuum von der Erfassung wörtlicher Informationen auf der 
Wort- und Satzebene bis hin zu umfangreichen, teils auch multimedialen Tex- 
ten bewegt. In Abbildung 1 werden zentrale Aspekte der Kompetenzstufen in 
Verbindung mit Textlänge und Komplexität modellhaft zusammengeführt. 
Stufe A bildet das rudimentäre Leseverstehen ab, das bei PISA 2018 explizit als 
Leseflüssigkeit operationalisiert und in das Lesekompetenzmodell aufgenom- 
men wurde. In IGLU 2016 wurde durch den Einsatz der oben beschriebenen 
zwei Untertests des ELFE-Verständnistests (ELFE II, Lenhard et al., 2017) das 
bisherige Lesekompetenzmodell um das rudimentäre Leseverstehen erweitert. 
Stufe B fokussiert auf das Verstehen von besonders leicht zu findenden explizi- 
ten Informationen. Auf Stufe C können explizite Informationen entnommen 
werden, die sich in benachbarten Sätzen befinden, während auf Stufe D die 
Informationen weniger explizit und zudem verstreut sind. Stufe E hingegen 
erfordert das höchste Maß an Inferenzbildung. Hier sind Informationen impli- 
zit vorhanden und können Aufgaben nur durch Reflektieren, Bewerten und 
Schlussfolgern gelöst werden. 


Abbildung 1: Synopse der aufeinander aufbauenden Fähigkeiten bei der Lesekompe- 
tenz in empirischen Studien 


A 
E Kohärenz herstellen und Inferenzen bilden auf Textebene 
D Verstreute Informationen auf Textebene Zunelimende 
inferenzbasiert verkniipfen Anforderunger 
C Einzelinformationen auf Satz- und Absatzebene mena 
inferenzbasiert verkniipfen strukturelle 
B Explizite Informationen auf Satzebene Komplexität 
entnehmen der Texte 
A Rudimentäres Leseverstehen 
(Leseflüssigkeit) * 
(eigene Darstellung, * = nur bei den jüngsten IGLU- und PISA-Studien explizit enthalten) 


3 Lesekompetenz - prozessbezogene Perspektiven 
auf zentrale Teilfähigkeiten 


Die Lesekompetenz umfasst viele Aspekte des Lesens. Man kann den Begriff 


eher eng fassen und nur diejenigen Teilkompetenzen einbeziehen, die Prozesse 
des verstehenden Lesens miteinbeziehen (z. B. das Entwickeln mentaler Reprä- 
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sentationen im Ergebnis von Inferenzprozessen). Man kann Lesekompetenz 
auch weiter fassen - zumal unter der Erwerbsperspektive - und sich zusätzlich 
auf solche Aspekte des Lesens beziehen, bei denen es noch nicht um Sinnver- 
stehen geht (z.B. das Dekodieren von Wörtern). Rosebrock (2012, S. 4) be- 
schreibt die Lesekompetenz entsprechend als „ein ganzes Bündel von Teilfähig- 
keiten“. Diese Teilfähigkeiten sind auf verschiedenen Ebenen angesiedelt. Ba- 
sale Leseleistungen wie die Automatisierung des Wort- und Satzlesens werden 
im Konstrukt der Leseflüssigkeit zusammengefasst und auch als hierarchienied- 
rige Leseprozesse bezeichnet. 

So betonen Lenhard und Schneider (2006, S. 13), dass bei den hierarchie- 
niedrigen Lesefähigkeiten Aspekte von zentraler Bedeutung sind, „die das Lese- 
verstehen auf Wortebene beeinflussen. Dazu gehören der Wortschatz des Kin- 
des, die Fähigkeit zum Dekodieren einzelner Wörter, die Erfassung der Wort- 
bedeutung sowie das Wissen, wie diese Bedeutung durch den jeweiligen Kon- 
text modifiziert wird“. Hier wird deutlich, dass das theoretische Konstrukt des 
Leseverständnisses auf hierarchieniedriger Ebene die visuelle Worterkennung 
als Voraussetzung für die Bedeutungserschließung einzelner Wörter sowie 
deren Vernetzung auf Satzebene einschließt. Die hierarchiehohen Leseprozesse 
umfassen das eigentliche Textverstehen und Durchdringen eines Textes. Neben 
der Bedeutungserschließung auf der Wort- und Satzebene müssen die Leserin- 
nen und Leser die aufgenommenen Informationen mit ihrem Vorwissen ver- 
knüpfen, um den Text als Ganzes zu erfassen. Dabei generieren sie ein mentales 
Modell des Textes, in dem das bisher Gelesene repräsentiert und reflektiert ist 
(Richter & Schnotz, 2018). 

Für das Lesen können also hierarchieniedrige und hierarchiehöhere Teil- 
prozesse unterschieden werden: Zuerst wird durch Buchstaben- und Worter- 
kennung das Wortmaterial erkannt (Dekodieren), das dann mit weiteren Wör- 
tern in einem Satz in Beziehung gesetzt werden muss. Hierbei ist eine Analyse 
der syntaktischen Strukturen notwendig, um zu einer inneren Repräsentation 
der Satzbedeutung zu gelangen. Die gelesenen Sätze werden in einem weiteren 
Prozess fortlaufend verknüpft zu einem inneren Modell der Textbedeutung. 
Dieses wird eingebettet in das Weltwissen der Lesenden. Das Lesen ist damit 
ein „hochgradig aktiver Prozess der Auseinandersetzung mit den jeweiligen 
Inhalten“ (Lenhard & Schneider, 2006, S. 13). Die Leseprozesse auf hierarchie- 
niedriger Ebene hingegen laufen automatisiert ab, d. h. praktisch ohne kogni- 
tive Kontrolle, wodurch Ressourcen für die hierarchiehöheren Prozesse des 
Textlesens frei bleiben. 

Das in den Bildungsstudien modellierte Konstrukt der Lesekompetenz fo- 
kussiert auf das Verstehen von Satz- und Textbedeutungen. Zwar wird ein 
breites Spektrum von Teilkompetenzen durch die Kompetenzstufen abgebildet, 
jedoch wird deutlich, dass die hierarchieniedrigen Leseprozesse, wie das Deko- 
dieren auf Wortebene oder die Leseflüssigkeit als Automatisierungsprozess nur 
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vereinzelt und vor allem eher als Randphänomen einbezogen werden. Betrach- 
tet man Lesekompetenz jedoch nicht nur als theoretische Rekonstruktion eines 
empirischen Ist-Zustandes, der eine punktuelle Leistung verdeutlicht, sondern 
als Lern- und Entwicklungsprozess, muss notwendigerweise auch der Beginn 
des Leselernens betrachtet werden. 


3.1  Leseflüssigkeit 
3.1.1 Definition und Dimensionalität 


Der Leseprozess beinhaltet den basalen Prozess des Dekodierens. Hierbei ent- 
schlüsseln Leserinnen und Leser die schriftlichen Zeichen, indem sie ihnen 
entsprechende konventionalisierte Bedeutungen zuordnen. Das Dekodieren 
wird durch Wiederholung automatisiert, um so das Arbeitsgedächtnis zu ent- 
lasten und dadurch wesentliche Informationen vorübergehend speichern und 
gleichzeitig verarbeiten zu können. So wird das flüssige Lesen erlangt. Dies ist 
zum Beispiel erforderlich, um einen Satz am Ende inhaltlich verstanden zu 
haben, ohne den Anfang bereits wieder vergessen zu haben. Damit bildet die 
Leseflüssigkeit eine notwendige Voraussetzung für die Bedeutungserschließung 
von Texten. Die Leseflüssigkeit gehört, wie oben dargestellt, zu den hierarchie- 
niedrigen Prozessen auf der Wort- bzw. Satzebene. Sie zählt zu den durch zahl- 
reiche Forschungsergebnisse gut dokumentierten Komponenten des Lesens. 

In der angloamerikanischen Forschungsgemeinschaft werden die hierar- 
chieniedrigen Leseprozesse unter dem Begriff Fluency subsumiert und bereits 
seit 40 Jahren verstärkt in den Blick genommen. Forschungsergebnisse belegen, 
dass die Leseflüssigkeit stark mit dem Leseverständnis korreliert, also für das 
Verstehen eines Textes von zentraler Bedeutung ist (Garcia & Cain, 2014; 
Wolters et al., in Druck). So ergeben die Studien, dass die Steigerung der Lese- 
flüssigkeit eine Verbesserung des Leseverständnisses mit sich bringt, und zwar 
ohne dass zusätzlich hierarchiehöhere Verstehensprozesse gefördert werden 
müssen (National Reading Panel, 2000). 

Leseflüssigkeit ist ein komplexes Konstrukt. Sie vereint in sich die genaue, 
automatisierte, schnelle, sinnkonstituierende Fähigkeit zu lautem und leisem 
Lesen, welche es ermöglicht, die Bedeutung des Gelesenen zu erschließen (Ro- 
sebrock & Nix, 2006, S. 94). Im Folgenden werden diese Einzelkomponenten 
kurz dargestellt: 


e Akkuratheit des Dekodierens: Falsch erlesene Wörter führen zu Bedeutungs- 
veränderungen (Pinnel et al., 1995). Nur das fehlerfreie Erlesen von Wör- 
tern führt zur schnellen und sicheren Bedeutungserschließung, denn 
Schwächen auf dieser basalen Ebene führen notwendigerweise zu Ein- 
schränkungen im Textverständnis. 
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e Automatisierung: Das Lesen muss automatisiert werden, um möglichst 
wenige kognitive Ressourcen für den Dekodierprozess aufzuwenden. So ist 
gewährleistet, dass genügend Kapazitäten für Bedeutungserschließungen 
bzw. Schlussfolgerungen zur Verfügung stehen (Samuels, LaBerge & Bre- 
mer, 1978). 

e Geschwindigkeit: Akkuratheit und Automatisierung bilden zusammen die 
Lesegeschwindigkeit. Langsame, stockende Leserinnen und Leser zeigen 
Schwächen im Leseverständnis, weil sie viel zu viele Informationen im Ar- 
beitsgedächtnis speichern müssen (Berliner & Casanova, 1988; Brown & 
Hirst, 1983). 

e Prosodisches Lesen: Leserinnen und Leser sollten im Stande sein, den Text in 
sinnkonstituierende Einheiten einzuteilen und dies durch ihre Betonung 
deutlich zu machen. Leserinnen und Leser, die einen Text zwar zügig und 
mit nur wenigen Fehlern, jedoch ohne jegliche Betonung lesen, verstehen 
den Text wahrscheinlich nicht umfassend (Schreiber, 1991). Neuere Be- 
funde unterstreichen, dass es substanzielle positive Zusammenhänge zwi- 
schen Prosodie und Leseverstehen gibt (Wolters et al., in Druck). 


3.1.2 Das Konstrukt der Leseflüssigkeit und die Beiträge in diesem Band 


Die Fähigkeit zu flüssigem Lesen gilt als eine Voraussetzung für das verste- 
hende Lesen. Für die Förderung der Leseflüssigkeit haben sich insbesondere 
Lautleseverfahren als wirksam erwiesen. Lautleseverfahren vereinen in sich 
unterschiedliche Aspekte der Förderung: Durch instruktionale Trainings wird 
vor allem die Automatisierung des Lesens erreicht. Beim wiederholenden Lesen 
lesen die Schülerinnen und Schüler einem Tutor (z. B. einem anderen Schüler 
oder einer anderen Schülerin) einen kurzen, für sie mittelschweren Text so 
lange immer wieder laut vor, bis sie eine zuvor festgelegte Flüssigkeit (definiert 
über Zeit) erreicht haben. Häufiges Wiederholen führt erwiesenermaßen zu 
einer besseren Verfügbarkeit von Kenntnissen und Fertigkeiten, denn auf diese 
Weise automatisiert sich der kognitive Zugriff auf das Gelernte (Hasselhorn & 
Gold, 2017). Dass die Förderung von Leseflüssigkeit erfolgreich ist und insbe- 
sondere durch Lautleseprogramme gute Effekte erzielt werden, ist eindeutig 
belegt (National Reading Panel, 2000). 

Leseflüssigkeit, das zeigt sich an der Dimension Prosodie, trägt Aspekte des 
Verstehens in sich (Wolters et al., in Druck). Auf Wortebene müssen Personen 
automatisiert auf die Semantik von sprachlichen Einheiten zugreifen können, 
um eine angemessene Prosodie zu erzielen. Dafür sind sie auch auf ihren Wort- 
schatz angewiesen, der seinerseits als wichtige Voraussetzung für das Lesever- 
stehen gilt (Philipp, 2012). Studien zeigen, dass Wortschatzförderung das Lese- 
verstehen erhöht (Elleman et al., 2009). Britta Juska-Bacher, Christoph Zangger 
und Martina Röthlisberger stellen in ihrem Beitrag in Kapitel 2 Ergebnisse ihrer 
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Studie zur Entwicklung von Wortschatz und Lesefahigkeiten bei Kindern der 
Primarstufe vor. Hierbei gehen sie der Frage nach, inwieweit Wortschatzkom- 
petenz mit der Lesekompetenz zusammenhängt. Ihre Ergebnisse aus der 
Grundlagenforschung illustrieren, dass Wortschatz und Leseverstehen zu Be- 
ginn der Schullaufbahn in autoregressiven Kreuzpfadmodellen statistisch un- 
verbunden sind, aber laut Fixed-Effects-Modell ein positiver Effekt vom Wort- 
schatz auf das Leseverstehen besteht. Anders gesagt: Wer in der ersten Klasse 
einen sowohl qualitativ als auch quantitativ stärker ausgeprägten Wortschatz 
hatte, zeigte ein Jahr später bessere Leseleistungen. 

Mareike Ehlert und Elmar Souvignier skizzieren in ihrem Beitrag zentrale 
Befunde zu wirksamen Fördermaßnahmen im Bereich der Leseflüssigkeit und 
stellen mit dem Programm „Der Lese-Sportler“ eine Möglichkeit zur Förderung 
in der Grundschule vor. Sie erläutern empirische Befunde, die zwar eine hohe 
Wirksamkeit gezielter Maßnahmen zur Förderung der Leseflüssigkeit belegen, 
aber auch zeigen, dass die Effekte in der schulischen Praxis niedriger ausfallen 
als in stärker kontrollierten Settings. Vor diesem Hintergrund diskutieren Ma- 
reike Ehlert und Elmar Souvigier drei Aspekte der Leseflüssigkeitsförderung - 
Passung, Dosierung und Wiedergabetreue - und ihre Bedeutung für die opti- 
male Entfaltung der Wirkung von Maßnahmen zur Förderung der Leseflüssig- 
keit. 


3.2 Lesestrategien 


Im vorangegangenen Abschnitt wurde Leseflüssigkeit als Teilaspekt der Lese- 
kompetenz auf hierarchieniedrigem Niveau behandelt. Es wurde deutlich, dass 
das flüssige Lesen eine Voraussetzung für das Verstehen von Texten ist. Im 
Folgenden wird darauf aufbauend das Kontinuum der Lesekompetenz weiter 
aufgespannt: über den Nutzen und den Einsatz von Lesestrategien bis hin zum 
Verstehen und Verarbeiten multipler Texte. 


3.2.1 Definition und Klassifikation 


Die Trennlinie von hierarchieniedrigen und -hohen Prozessen lässt sich anhand 
mehrerer Unterscheidungsmerkmale ziehen. Erstens besteht eine Differenzie- 
rung von automatisiert ablaufenden, nicht steuerbaren Prozessen und solchen, 
die sich in Bezug auf Ziele prinzipiell steuern lassen - erstgenannte Prozesse 
bilden die hierarchieniedrigen Fähigkeiten, letztere die hierarchiehohen Fähig- 
keiten (Afflerbach et al., 2008). Zweitens ist auch die Textmenge und der sich 
daraus ergebende inhaltliche Verarbeitungsaufwand ein Distinktionsmerkmal: 
Bei hierarchieniedrigen Prozessen bilden Sätze in der Regel die Grundlage, 
während hierarchiehohe Prozesse sich auf längere Textteile, ganze Texte oder 
sogar multiple Texte beziehen (Lenhard, 2019; List & Alexander, 2019). Kenn- 
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zeichnend fiir die hierarchiehohen Prozesse ist damit, dass die lesende Person 
diverse steuerbare Prozesse auf eine solche Art orchestriert, dass textuelle In- 
formationen und eigenes Wissen verstehensforderlich bzw. zielbezogen auf 
einer Objektebene interagieren lässt. Hinzu kommen weitere, über den eigentli- 
chen mit der Sinnkonstruktion auf der Objektebene stattfindenden Uberwa- 
chungs- und Regulationsprozesse, die auf einer Metaebene ablaufen und der 
Zielerreichung dienen (Bruin et al., 2020). Solche verstehensförderlichen zielbe- 
zogenen Aktivitäten, die zu weiten Teilen auf metakognitiven Wissensbestän- 
den, also Wissen über Kognitionen, basieren, nennt man Lesestrategien (Phi- 
lipp, 2015). 

Die Lesestrategieforschung hat ihre Wurzeln zum Teil in Studien mit qua- 
litativ gewonnenen Laut-Denk-Protokollen. Hierbei handelt es sich um Unter- 
suchungen, in denen in aller Regel versierte Leserinnen und Leser lesebezogene 
Aufgaben erhielten und dabei parallel zur Aufgabenbearbeitung ihre Gedanken 
verbalisieren sollten. Diese aufgenommenen und transkribierten Gedanken- 
ströme bildeten als Laut-Denk-Protokolle dann den Gegenstand der Codierun- 
gen und Analysen. Solche Primärstudien wurden in Forschungsüberblicken 
zusammengefasst (Pressley & Afflerbach, 1995; Cho & Afflerbach, 2017; Israel, 
2015), welche sich der Aufgabe angenommen haben, zum einen studienüber- 
greifende Muster in Form von funktionsbezogenen Klassifikationen der Strate- 
gien (Pressley & Afflerbach, 1995; Cho & Afflerbach, 2017) vorzunehmen oder 
zum anderen entwicklungsbezogene Differenzen (Israel, 2015) herauszuarbei- 
ten. Ein erstes wichtiges Ergebnis ist, dass gute Leserinnen und Leser variable 
Vorgehensweisen zeigen und dabei auf einen Verbund von Lesestrategien set- 
zen, der je nach Stand im Kompetenzerwerb verschieden elaborierte Kombina- 
tionen von Strategien widerspiegelt. Ein zweites wichtiges Ergebnis lautet: Die 
einzelnen Strategien treten in der Regel im konzertierten, flexiblen und adapti- 
ven Verbund auf und dienen dazu, aktuelle und übergeordnete Verstehens- 
leistungen zu ermöglichen. 

Strategien dienen beim Lesen unterschiedlichen Zwecken, erfüllen also un- 
terschiedliche Funktionen. Die verschiedenen Funktionen der Lesestrategien 
für das Leseverstehen bilden den Grundstein für einen weithin etablierten Klas- 
sifikationsversuch, der seinerseits seinen Ursprung in Taxonomien von Lern- 
strategien hat (als übergeordnete, domänenunspezifischen Handlungspläne zur 
Unterstützung der inhaltlichen Aneignung und Speicherung von Lerninhalten; 
Weinstein & Mayer, 1986). Aus diesen Strategien sind zwei Gruppen, die ihrer- 
seits noch weiter unterteilt werden können, besonders deutlich herausgearbeitet 
worden: kognitive Strategien und metakognitive Strategien. Kognitive Strategien 
dienen dazu, dass Leserinnen und Leser eine sinnvolle Interaktion zwischen 
text- und vorwissensbezogenen Prozessen vornehmen (sogenannte Objekt- 
ebene), während die metakognitiven Strategien auf einer Metaebene diese inter- 
agierenden Prozesse initiieren, überwachen und regulieren - beides unter ef- 
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fektiver Nutzung der Arbeitsgedachtniskapazitat (Bruin et al., 2020). Diese 
Gruppen von kognitionsbezogenen Strategien sind in Tabelle 1 dargestellt; es 
handelt sich hierbei dezidiert nur um einen Ausschnitt von Strategien 
(s. Philipp, 2015, für einen Überblick über weitere Lesestrategien, sowie Hattie 
& Donoghue, 2016, für einen allgemeinen Überblick über verschiedene Lese- 
strategien). 


Tabelle 1: Selektiver Überblick über Lesestrategien 


Gruppe von Strategien | Beschreibung Beispiele 
A) Kognitive Strategien 


A1) Organisations- Inferenzbasierte Rekon- — Zusammenfassungen oder 
strategien struktion der Struktur von Synthesen schreiben 
Lerngegenstanden — Hauptideen unterstreichen 


— Concept-Map oder ein anderes 
Schaubild erstellen 


A2) Elaborations- Aktives Verknüpfen von — Textinhalte imaginieren 
strategien neuen Informationen mit |- Unbekannte Wörter klären 
Vorwissensbeständen, um |- Fragen an den Text formulieren 


gegebene Inhalte anzurei- 
chern (zu elaborieren) 


B) Metakognitive Strategien 


B1) Planungs- Vorbereitung der Leseakti- | - Entscheiden, welches Verste- 

strategien vität durch Formieren von hensniveau benötigt wird (Kohä- 
Lesezielen und Kohärenz- renzstandards festlegen) 
standards — Textteile portionieren und priori- 

sieren 

B2) Uberwachungs- Uberwachen des Fort- — Fragen an sich selbst formulie- 

strategien schritts in Bezug auf die ren, um das eigene Verstehen zu 
Zielerreichung klaren 


— Inhalte gezielt in eigenen Worten 
wiedergeben und erklären 


B3) Selbstregulations- | Verändern und Optimieren |- Verlangsamung des Lesetempos 
strategien des kognitiven und meta- |- Spezifische erneute Lektüren 
kognitiven Strategieeinsat- einzelner Teile mit teils geänder- 
zes ten Lesezielen 
— Auswahl einer neuen Herange- 
hensweise 


Eigene Darstellung, basierend auf Friedrich & Mandl, 2006, und Pressley & Afflerbach, 1995) 


Die Klassifikationen der Lesestrategien - auch jene aus Tabelle 1 - entstammen 
aus Studien, in denen häufig das möglichst umfassende Verstehen einzelner 
gedruckter (Sach-)Texte untersucht wurde. Damit geben sie Einblick in einen 
limitierten Ausschnitt dessen, was bei der Lesekompetenz gefordert ist. Nicht 
nur fehlen literarische Texte mit ihren sprachlich-ästhetischen Eigenheiten 
häufig, sondern es ergeben sich im sich wandelnden Lesealltag andere Heraus- 
forderungen (welche beispielsweise PISA 2018 schon explizit aufgegriffen hat, 
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s. Teilkap. 2.2.3). Darunter fallen die Lektüren elektronischer, multimodaler 
und multimedialer Texte ebenso wie das Lesen multipler Texte - unter Realbe- 
dingungen müssen sich Leserinnen und Leser diese Texte erst über Suchma- 
schinen suchen (Bräten et al., 2020). All dies setzt teils andere, teils neue Strate- 
gien voraus, um den lesebezogenen Anforderungen vollumfänglich gerecht zu 
werden (Cho & Afflerbach, 2017). Kurzum: Das Lesestrategiespektrum für die 
alltäglich nötige Lesekompetenz diversifiziert sich und erhöht damit die Anfor- 
derungen für alle Personen, die aktiv an der schriftbezogenen Kommunikation 
teilhaben wollen. 


3.2.2 Die lesedidaktisch bedeutsame Frage nach der Vermittelbarkeit 
von Lesestrategien und die Beiträge in diesem Band 


Lesestrategien gelten gemäß den Ausführungen aus dem Teilkapitel 3.2.1 als 
bedeutsam für das kompetente Lesen, und Entwicklungsmodelle betonen, dass 
kompetente Leserinnen und Leser über ein Inventar verschiedener Lesestrate- 
gien verfügen (Alexander, 2005). Auch andere theoretische Zugänge postulie- 
ren einen Zielhorizont des kompetenten Lesens, der auf einer Vielzahl von 
verfügbaren Lesestrategien verschiedener Funktionen basiert (Pressley & 
Afflerbach, 1995). Damit stellt sich die Frage, wie Personen solche Strategien in 
ihrem Verbund erwerben und erwerben sollen. 

Als ein in der Forschung breit etablierter Zugang hat sich die explizite Stra- 
tegievermittlung erwiesen, bei der Lernende von kompetenten anderen im 
Sinne des Beobachtungslernens die Strategieanwendung erklärt, vorgeführt und 
metakognitiv kommentiert stellvertretend erleben und analysieren können. Auf 
dieser Basis repräsentieren Lernende kognitiv zunächst die Anwendung der 
Strategien, ehe sie sie im Sinne eines allmählichen Übertrags der eigenverant- 
wortlichen Strategieanwendung diese didaktisch portioniert selbst reprodu- 
zierend anwenden und sich sukzessive sowohl Automatisierungs- als auch 
metakognitive Evaluationsprozesse flankieren. Dies hat eine Doppelfunktion im 
Erwerb: Die eigentliche Ausführung der Strategie soll einerseits selbst weniger 
kognitive Belastung generieren und fehlerfreier erfolgen, andererseits soll das 
konditionale Strategiewissen konsolidiert werden (Philipp, 2015). 

Trotz dieser aus verschiedenen Theoriesträngen plausibilisierbaren Abfolge 
von Vermittlungsschritten bzw. -phasen mit klar definierter Funktion im Ge- 
samtzusammenhang besteht ein hartnäckiges Problem darin, dass diese expli- 
zite Vermittlung von kognitiven und metakognitiven Strategien im Unterricht 
nicht oder nur verkürzt vorkommt (z. B. für Befunde aus Deutschland: Schmitz, 
2019). Möglicherweise hat dies damit zu tun, dass Strategievermittlung ein 
komplexes Unterfangen ist, das seitens der Lehrenden als Gelingensbedingung 
neben profundem lesedidaktischem Wissen auch eine Form der Unterrichts- 
entwicklung voraussetzt, damit Lernende umfassende Repräsentationen zum 
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Zweck und Ziel strategischen Lesens überhaupt erlangen (Duffy, 1993). Vor 
diesem Hintergrund stellt sich die Frage, was denn unverzichtbare, die Wir- 
kung der Lesestrategievermittlung nicht nur in der Strategieanwendung, son- 
dern auch für den sich im Leseverstehen niederschlagenden Erfolg beeinflus- 
sende Elemente sind. Solchen Fragen geht die Forschung inzwischen nach, wie 
es beispielsweise die Metaanalyse von Okkinga et al. (2018) illustriert. 

Davon ungeachtet sind auch Primärstudien aus einer didaktischen Perspek- 
tive gefragt, die wirksamen Konstituenten einer Fördermaßnahme klar heraus- 
zuarbeiten. Eher unfreiwillig, nämlich forciert durch die Covid-19-Pandemie, 
ist dies zum Gegenstand der Analysen im Kapitel 4 von Johannes Wild, Elisa- 
beth Kraus, Maria Steinert, Sven Hilbert und Anita Schilcher avanciert. Im 
Rahmen einer laufenden Interventionsstudie (FiLBY) mit Grundschulkindern 
der dritten Schulklasse konnten sie anhand von Leistungsentwicklungen im 
Leseverstehen und per Online-Fragebogen von den Lehrpersonen erfragten 
Unterrichtsmerkmalen auf breiter Basis zeigen, dass ein abrupter Wechsel auf 
nicht vom Programm so vorgesehene lesedidaktische Entscheidungen sogar 
nachteilig für die Entwicklung des Leseverstehens ist. Nur die Einführung der 
Sachtextstrategien durch die Lehrperson war hingegen vorteilhaft für einen 
Zuwachs im Leseverstehen. Solche Befunde sind wichtig, weil sie helfen, den 
Weg zu ebnen von evidenzbasierten Förderprogrammen in den Regelunter- 
richt. 


3.2.3 Ein sich abzeichnendes neues Feld der Leseforschung (Lesen 
multipler Texte) und die Beiträge in diesem Band 


Die Synopse der produktbezogenen Anforderungen von Leseverstehensleistun- 
gen, die im Teilkapitel 2.2.4 aus den Leseleistungsstudien extrahiert wurde, 
bildet einen Schwerpunkt ab, der auf das schlussfolgernde Kombinieren von 
Informationen aus distalen, sprich: weiter entfernten Textteilen und multiplen 
Texten fokussiert. Solche Schlussfolgerungen werden in der Leseforschung als 
(vorwissensbasierte) „Inferenzen“ bezeichnet und gelten als conditio sine qua 
non des Leseverstehens (Kendeou et al., 2016). Inferieren als Sammelbegriff 
bezeichnet - aus einer Prozessperspektive - die Fähigkeit einer lesenden Per- 
son, Informationen (aus dem Text und/oder dem Vorwissen) miteinander 
schlussfolgernd zu kombinieren, sodass Informationslücken in Texten gefüllt 
werden. Solche Inferenzen als Produkt werden nicht nur dazu benötigt, den 
Sinnzusammenhang in Textpassagen kohärent zu erkennen. Sie stehen aktuell 
auch deutlich erkennbar im Interesse der Forschung zu multiplen Texten. Das 
Lesen von mehreren Texten erfordert erhöhte Kohärenzleistungen, da die Ma- 
terialität, Modalitat und kommunikative Absicht verschiedener Texte nebst 
ihren textuellen Merkmalen (Textsorte, Lexik etc.) hochdivergierend sein kann. 
Entsprechend handelt es sich um schwierigkeitsgenerierende Merkmale, welche 
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eine erhöhte kognitive Belastung mit sich bringen (Ainsworth, 2018; Sweller, 
2010). Hinzu kommt, dass intra- und intertextuelle Inferenzen gleichermaßen 
benötigt werden, damit die lesende Person mentale Modelle entwickeln kann. 
Sie muss also einzelne Texte ebenso verstehen wie die Gesamtheit der gelesenen 
Texte, und dafür braucht sie wiederum Strategien - viele fallen unter das Ziel, 
wie sich intertextuelle Kohärenz inferenzbasiert herstellen lässt, z. B. mit Quer- 
verweisen in Notizen auf ähnliche thematische Aspekte in anderen gelesen 
Texten (List et al., in Druck). 

Die Forschung zum Lesen und Nutzen multipler Texte nimmt etwas auf, 
was andernorts bereits ein eigenes Feld der Leseforschung war: jene zu den 
Aufgabeneffekten. Die oftmals unhinterfragte Perspektive auf das Lesen bestand 
in der Vergangenheit darin, dass eine Person einen Text möglichst so versteht, 
dass ein adäquates mentales Modell das Resultat ist. Dieses Primat wurde von 
der aktuellen Leseforschung jedoch erschüttert, indem zunehmend die ver- 
wertungsbezogene leserseitige Einschätzung und Verarbeitung von Informatio- 
nen und Texten fokussiert wird. Es geht also um ein instrumentelles, ein ver- 
wertendes Lesen, das beispielsweise darüber entscheidet, ob man Texte gänzlich 
verstanden oder singuläre Informationen aus ihnen extrahiert haben muss 
(Britt et al., 2018; Oudega & van den Broek, 2018). Dass und wie die Leserinnen 
und Leser sich dazu entscheiden, Informationen zu verwenden oder zu igno- 
rieren, wird gegenwärtig verstärkt Gegenstand empirischer und theoretischer 
Arbeiten (McCrudden, 2018; McCrudden et al., 2011a) - nicht zuletzt, weil be- 
reits die erfolgreiche Nutzung von Suchmaschinenergebnissen unter anderem 
auf dieser Fähigkeit der Relevanzzuweisung basiert. 

Damit hängt zusammen, was sich ebenfalls deutlich in der Forschung her- 
ausschält: die Lesekompetenz multipler Texte und die Fähigkeit, das Lesever- 
stehen in eigenen schriftlichen Texten zu dokumentieren. Tatsächlich zeigt sich 
in der Grundlagenforschung eine deutliche Tendenz, Lesen und Schreiben zu 
integrieren (Primor & Katzir, 2018). Das ergibt sich daraus, dass die Texte, die 
Personen über multiple Texte schreiben, als Produkt der aufgabenbezogenen 
Nutzung von multiplen Texten behandelt werden und besonders reichhaltige 
Analysegegenstände bilden. Sie eröffnen damit produktbezogene (und damit 
notwendigerweise eingeschränkte) Einblicke in Verstehensleistungen. Das 
bildet einerseits die sich wandelnden Kompetenzanforderungen ab, nach denen 
sich die Lesekompetenz auch daran bemisst, Verstandenes schriftlich adäquat 
weiter zu kommunizieren (Leu et al., 2017), was im deutschsprachigen Raum 
aktuell im Diskurs zum materialgestützten Schreiben behandelt wird. Anderer- 
seits weicht damit das Konstrukt Lesekompetenz auf: Es weist eine Schnitt- 
menge mit der Schreibkompetenz auf. Dies zeigt sich in den Prozessen, die sich 
kaum noch eindeutig als nur lese- oder nur schreibbezogen entwirren lassen 
(Spivey, 1997). 
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Ein Nebeneffekt all dieser Entwicklungen ist, dass in der Leseforschung zu- 
nehmend auch Leserinnen und Leser im Erwachsenenalter starker betrachtet 
werden. Zum einen bilden sie - zumal, wenn es sich um Studierende handelt - 
ein Convenience-Sample, das für Forschungsprozesse niederschwellig zu errei- 
chen ist. Die Fokussierung auf Erwachsene - zumal solche aus Einrichtungen 
der Tertiärbildung - erlauben es auch, die wichtige Thematik der (normativen) 
Anschlüsse zwischen den Bildungsetappen genauer in den Blick zu nehmen. 
Dies zeichnet sich deutlich in der Logik der zyklischen Leseleistungsstudien ab, 
die nicht zufällig das Ende von Schulstufen fokussieren, aber noch selten Über- 
gänge in andere Zweige des Bildungssystems in den Blick nehmen. Einen Son- 
derfall bilden die Lesefähigkeiten von Studierenden, die später Lehrpersonen 
werden und deren lesestrategisches Repertoire allein deshalb von Interesse sein 
sollte, weil es der Gegenstand späterer fachdidaktischer Kompetenz ist (Akyol 
& Ulusoy, 2010). 

Diese Veränderungen in der Leseforschung spiegeln die Beiträge von Alex 
Rickert und Maik Philipp wider. Alex Rickerts und Maik Philipps Kapitel (Ka- 
pitel 5) geht beispielsweise darauf ein, welche Leistungen und welche Schwie- 
rigkeiten sich im Längsschnitt bei Lehramtsstudierenden aus der Schweiz zei- 
gen. So divergieren die gezeigten Leistungen systematisch je nach kognitivem 
Anspruchsgrad und finden dort Grenzen, wo es um tiefe Verstehensleistungen 
mit hohem kognitiven Transformationsgrad geht. Markant sind zusätzlich die 
geringen Zusammenhänge zwischen den drei von ihnen untersuchten Prozes- 
sen des Lesens, die sie in den Texten aufwändig rekonstruiert haben. Mit ähnli- 
cher Perspektive auf die Produkte des Leseverstehens widmet sich Maik Philipp 
den Aufgabeneffekten beim schriftlichen Synthetisieren anhand einer Sekun- 
däranalyse von Experimentalstudien mit überwiegend erwachsenen Leserinnen 
und Lesern (Kapitel 6). Sein Hauptergebnis ist, dass verschiedene unabhängige 
Variablen - gerade in der Kombination - komplexe Befundmuster nach sich 
ziehen. Dennoch gibt es ein Muster: Je komplexer die nötigen Lese- und 
Schreibstrategien waren und je mehr Transformationen sie nach sich zogen, 
desto stärker fielen Vor- und Nachteile des argumentierenden bzw. informie- 
renden Schreibens über mehrere Texte ins Gewicht. 


4 Fazit: Warum sich mit den „Enden“ des gegenwärtigen 
Kompetenzspektrums befassen? 


Wir haben in diesem Beitrag das Konstrukt Lesekompetenz behandelt und es 
aus produkt- und prozessbezogener Perspektive betrachtet, um daraufhin die 
fünf empirischen bzw. empiriebasierten Beiträge zu verorten. Diese Verortung 
erfolgte auf einem Kontinuum der Lesekompetenz, das sich von dem flüssigen 
Lesen (bzw. dessen Vorläufern) hin zum Leseverstehen und Nutzen multipler 
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Texte erstreckte (s. dazu die Synopse im Teilkapitel 2.2.4). Dieses Kontinuum 
ist zugegeben sehr weit, allerdings nicht neu (Perfetti, 1997). Es eröffnet den 
Blick auf Aufgaben und Felder der Lesedidaktik und der Leseforschung. In 
diesem Band werden insbesondere die Enden dieses Kontinuums, also die Le- 
seflüssigkeit auf der einen und das Verstehen und Verarbeiten multipler Texte 
auf der anderen Seite, in den Blick genommen. Wir sammeln abschließend 
einige Argumente, warum wir die Beschäftigung mit diesen Kontinuumsenden 
für gewinnbringend halten. 


4.1  Leseflüssigkeit 


Wie oben beschrieben hat sich die Forschung zur Leseflüssigkeit im deutsch- 
sprachigen und insbesondere im angloamerikanischen Raum etabliert. Trotz- 
dem ist dieses Forschungsfeld noch nicht vollständig erforscht worden. Dies 
illustrieren die folgenden drei Argumente, die dafür sprechen, sich weiterhin 
intensiv mit dieser Teilkompetenz zu befassen. 


4.1.1 Der Leseflüssigkeit kommt als Voraussetzung für 
das Leseverstehen eine zentrale Bedeutung zu 


Es ist evident, dass das schnelle, akkurate und automatisierte Lesen geringere 
kognitive Ressourcen benötigt und in der Folge kognitive Kapazitäten für hö- 
here Verstehensleistungen frei werden. So belegen bereits 1974 die Arbeiten 
von LaBerge und Samuels die Relevanz der Automatisierung für das Arbeitsge- 
dächtnis. Dass die Leseflüssigkeit als Prädiktor für das Leseverstehen gilt, zeigen 
z.B. die Arbeiten von Klicpera und Kollegen (1993). Langsame disfluente Lese- 
rinnen und Leser lesen stockend, konzentrieren sich auf das Dekodieren und 
können dem Gelesenen keinen Sinn entnehmen. Das Lernen in allen Fächern 
wird erschwert. Zudem ist die Schrift in unserer hoch literalen Gesellschaft 
omnipräsent. Das Beherrschen des Lesens ist deshalb unverzichtbare Voraus- 
setzung für die Teilhabe an Bildung, Berufswelt und Gesellschaft. Das Lesen gilt 
daher zurecht als Schlüsselqualifikation. 


4.1.2 Die Forschung zur Leseflüssigkeit weist noch blinde Flecken auf 


Es gibt eine breite Studienlage zur Wirksamkeit von Förderprogrammen zur 
Steigerung der Leseflüssigkeit und ihrer Auswirkung auf das Textverstehen 
(z. B. Therrien, 2004; Chard et al, 2002). Eine differenzierte Forschung, die die 
moderierenden Faktoren beim Einsatz von Förderprogrammen in der Schul- 
praxis zum Gegenstand haben, muss jedoch noch geleistet werden (s. Kap. 3 in 
diesem Band). Neben der Frage nach Konzepttreue, Dosierung und Passung 
der Förderprogramme wissen wir z. B. noch wenig über mögliche Auswirkun- 
gen der Tandemkonstellationen bei kooperativen Lesesettings. Auch die einzel- 
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nen Teilaspekte des mehrdimensionalen Konstrukts Leseflüssigkeit finden 
unterschiedlich stark Beachtung. So findet das prosodische Lesen erst in jüngs- 
ter Zeit Eingang in die Leseforschung (Wolters et al., in Druck, Sappok et al., 
2020). 


4.1.3 Die Förderung der Leseflüssigkeit ist noch nicht ausreichend 
in der Schulpraxis etabliert 


Neben der Erforschung von Lern- und Lehrgegenständen ist die Frage des 
Transfers von zentraler Bedeutung. Die Forschung kann und sollte einen Bei- 
trag zu einer evidenzbasierten Bildungspolitik und -verwaltung sowie Bil- 
dungspraxis leisten und Impulse geben, die zu verbesserten (Lese-)Leistungen 
von Schülerinnen und Schülern führen sollen. So etabliert wie die Forschung 
zur Förderung der Leseflüssigkeit ist, so unbefriedigend ist bislang der Transfer 
evidenzbasierter Fördermethoden in die schulische Praxis (Philipp, 2014). 


4.2 Lesestrategien (bei multiplen Texten) 


Die Erforschung von Lesestrategien ist keineswegs neu, sondern im Gegenteil 
gibt es dazu eine reiche und reichhaltige Tradition (s. dazu aktuell z. B. Dins- 
more et al., 2020, und Philipp, 2015). Wenn man sich spezifisch dem Lesen 
multipler (vor allem digitaler) Texte als einem historisch jungen Feld der Lese- 
forschung zuwendet (Bräten et al., 2020; List, 2020), dann beginnt sich ein For- 
schungsfeld zu konturieren, welches vermutlich ein hohes Energetisierungs- 
potenzial hat, indem es nach Grundlagen- und Interventionsforschung 
gleichermaßen verlangt, um neue Herausforderungen zu erkennen und pro- 
aktiv lesedidaktisch anzugehen. Drei Argumente sprechen dafür. 


4.2.1 Die Prozesse des Lesens werden vielfältiger und komplexer 


Wer mehr als einen Text liest und die Inhalte aufeinander beziehen will, benö- 
tigt dafür noch Prozesse auf der Ebene des einzelnen Textes, darunter jene 
hierarchieniedrigen des flüssigen Lesens. Aber es kommen Anforderungen 
hinzu (Philipp, 2018, 2020). Darunter fallen das Erkennen intertextueller Rela- 
tionen, z.B. dass Textinhalte einander ergänzen oder widersprechen, dass ein 
Gegenstand als solcher divergierend dargestellt wird - oder sogar unvollständig 
(«intertextuelles Integrieren»; List & Alexander, 2019). Weiterhin müssen Lese- 
rinnen und Leser darauf achten, dass Darstellungen tendenziös oder sogar 
sachlich unrichtig sein können, sie müssen also mit dem eigenen Weltwissen 
einen Abgleich vornehmen, um Falschaussagen zu detektieren und zurückzu- 
weisen («epistemisches Validieren»; Richter & Maier, 2017). Insbesondere 
wenn das eigene Vorwissen nicht ausreicht, benötigen Leserinnen und Leser die 
«Sourcing» genannte Fähigkeit, die Metadaten - also Informationen zur Auto- 
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rin bzw. zum Autor oder zum Erscheinungskontext wie offiziellen Medien mit 
einer gewissen Reputation bzw. einem fragwürdigen Status - zum Evaluieren zu 
nutzen (Braasch & Scharrer, 2020). Dieses intertextuelle Integrieren und das 
Sourcing - und das sich dazwischen einfügende epistemische Validieren - sind 
Konstituenten des angemessenen Leseverstehens multipler Texte (Philipp, 
2020) und bedürfen zukünftig erhöhter Aufmerksamkeit. 


4.2.2 Der Aufgabenbezug wird prominenter 


Ein weiterer Strang der Forschung, der sich deutlicher abzuzeichnen beginnt, 
ist, dass nicht mehr nur das Leseverstehen einzelner rein schriftsprachbasierter 
Texte beforscht wird. Vielmehr wird ein instrumentelles Lesen zunehmend 
akzentuiert, bei dem eine Aufgabenstellung und deren kognitive Repräsentation 
maßgeblich Prozesse und Produkte beeinflussen (Rouet et al., 2017). Der ent- 
scheidende Punkt ist hierbei, dass Zielvorstellungen zum Aufgabenprodukt 
früh und prägend auf die Vorgehensweisen der Leserinnen und Leser einwirken 
(List & Alexander, 2019). Solche Überlegungen sind stark gespeist aus der For- 
schung zu Relevanzeffekten, also zu der Forschung, die sich der Frage widmet, 
wie die Zuweisung von Eignung einzelner Informationen, Informationseinhei- 
ten und ganzer Texte für die Zielerreichung - ihrer Relevanz - günstige und 
ungünstige Auswirkungen hat (McCrudden & Schraw, 2007, s. einen Überblick 
bei Philipp, i. Vorb.). Solche Relevanzprozesse zu kennen, ist lesedidaktisch 
hochbedeutsam, weil gerade das Finden und Lesen multipler Texte im Internet 
eigene Anforderungen mit sich bringt, die ihrerseits mehr Selbstregulation 
erfordern (Wylie et al., 2018). Hierbei ist Relevanzzuweisung einerseits eine 
Entlastung, weil sie dabei hilft, die eigenen Ressourcen zielführend einzusetzen 
(McCrudden & Schraw, 2007), doch sie ist andererseits nicht voraussetzungs- 
los, sondern im Gegenteil stark mit dem Vorwissen assoziiert - und mit dem 
Wissen, wie man Strategien sinnvoll für die Erreichung von Zielen nutzt, die 
unterschiedliche Verarbeitungstiefen und Transformationsgrade erfordern 
(Hattie & Donoghue, 2016). Dennoch klafft hier eine große Forschungslücke 
(McCrudden et al., 2011b). 


4.2.3 Lesen und Schreiben verschmelzen 


Mit dem Aufkommen des materialgestützten Schreibens als (wissenschaftspro- 
pädeutischem) Prüfungsformat ist die Hybridität von Lesen und Schreiben bei 
der Bearbeitung komplexer Aufgaben auch im deutschdidaktischen Diskurs - 
genauer: in der Schnittmenge des vor allem argumentativen Lesens und Schrei- 
ben - angelangt (Schüler, 2018). Ein besonderes Merkmal des materialgestütz- 
ten Schreibens - also des Schreibens eines eigenen Sachtexts auf der Basis meh- 
rerer zu nutzender Texte (bzw. «Materialien») - ist sein hoher kognitiver An- 
forderungsgrad: Personen müssen Informationen lesend und schreibend aus- 
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wählen, strukturieren und vorwissensbasiert im Sinne des Inferierens verknüp- 
fen (Spivey, 1990). Für eine möglichst optimale Leistung ist die Hybridität nicht 
nur aus einer grundsätzlichen Logik des kombinierten (aufgabenbezogenen) 
Lesens und Schreibens entscheidend, sondern auch aus prozessualer Sicht: 
Lesen und Schreiben gehen ineinander über, es kommt zu einem teils schnellen 
Wechsel von Lese- und Schreibaktivitäten innerhalb eines komplexen Pro- 
blemlöseprozesses, und es ist sogar für einen gelingenden eigenen Text notwen- 
dig, dass Personen selbstreguliert diese Hybridität im Prozess realisieren (Van- 
dermeulen et al., 2020). 


In den schlaglichtartigen Argumenten, warum es sich lohnt, sich weiterhin mit 
der Leseflüssigkeit sowie dem Lesen multipler Texte zu befassen, wird deutlich: 
Die Leseforschung hat längst nicht ausgedient, sondern im Gegenteil noch 
vieles zu leisten. 
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Methoden zur differenzierten Auswertung 
von Wortschatzkompetenzen und ihre 
Bedeutung fur das fruhe Lesen 


Britta Juska-Bacher, Christoph Zangger & Martina 
Rothlisberger 


Zusammenfassung: In der vorliegenden Studie wurden die Zusammenhänge zwischen 
Leseverständnis und Wortschatzkompetenzen sowie deren Entwicklung bei Schul- 
beginn untersucht. In einem längsschnittlichen Design wurden dieselben Grundschul- 
kinder (N = 313) in der ersten Klasse (t1) und in der zweiten Klasse (t2) auf verstehen- 
des Lesen von Wort, Satz und Text, die drei Wortschatzvariablen Wortschatzumfang, 
relationales und semantisches Wortwissen sowie die Vorläuferfertigkeiten phonolo- 
gische Bewusstheit, schnelles Benennen und Rekodiergeschwindigkeit getestet. Das 
Cross-Lagged-Modell, mit dem die Daten längsschnittlich analysiert wurden, zeigte 
nach Korrektur der autoregressiven Effekte keinen signifikanten Einfluss des Wort- 
schatzes zu t1 auf das Leseverständnis zu t2. Eine vertiefte Analyse der Beziehung 
zwischen Wortschatzvariablen und verstehendem Lesen offenbarte indes ein spezifi- 
sches Muster: Die Korrelationen zwischen Leseverständnis und Wortschatzvariablen 
waren zu t2 deutlich höher als zu t1. Zudem zeigten Varianzanalysen eine deutlich 
stärkere Entwicklung des Leseverständnisses im Vergleich zum Wortschatz. Im Fixed- 
Effects-Modell schließlich manifestierten sich diese Ergebnisse in Form eines hoch- 
signifikanten Effekts der Wortschatzentwicklung auf das verstehende Lesen. Die kom- 
plexe Natur der Beziehung zwischen Wortschatz und Lesen erfordert ganz offensicht- 
lich eine differenzierte Betrachtung der Wechselwirkungen. 


Schlüsselwörter: Leseerwerb, Wortschatzentwicklung, Wortschatztests, statistische 
Analyse 


Abstract: The present study investigated the relationships between early reading com- 
prehension and vocabulary skills and their development. In a longitudinal design, the 
same primary school children (N = 313) were tested in first grade (t1) and in second 
grade (t2) for reading of words, sentences and texts, the three vocabulary variables 
vocabulary size, network and semantic word knowledge as well as the precursors 
phonological awareness, rapid naming and decoding speed. The cross-lagged model, 
with which the data were analysed longitudinally, showed no significant influence of 
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vocabulary at t1 on reading at t2 after correction for autoregressive effects. However, a 
more in-depth analysis of the relationship between vocabulary variables and reading 
revealed a specific pattern: the correlations between reading and vocabulary variables 
were significantly higher at t2 than at t1. In addition, variance analyses showed a 
significantly stronger development of reading compared to vocabulary. Finally, in a 
fixed-effects model, these results manifested themselves in the form of a highly signifi- 
cant effect of vocabulary development on comprehension reading. The complex nature 
of the relationship between vocabulary and reading thus clearly requires a differen- 
tiated view of the interactions. 


Keywords: Reading acquisition, vocabulary development, vocabulary tests, statistical 
analysis 


1 Einleitung 


Lesen beinhaltet die Fähigkeit, geschriebene Symbole arbiträr Sprachlauten 
zuordnen zu können und diese zu größeren Einheiten zu synthetisieren. Die 
Lautfolgen als sprachliche Form werden wiederum arbiträren Bedeutungen 
zugeordnet, mittels derer sich der Inhalt der geschriebenen Sprache erschließt. 
In diesem Sinne ist Schriftsprache doppelt arbiträr, und Lesen muss als kom- 
plexes Konstrukt, das aus mehreren Teilprozessen besteht, betrachtet werden. 
Während die Teilprozesse beim erwachsenen, geübten Leser kaum mehr isoliert 
betrachtet werden können, spielen die Entschlüsselung der Form oder das Re- 
kodieren und die Entschlüsselung des Inhalts oder das Dekodieren beim frühen 
Lesen von Kindern klar erkennbare, unterschiedliche Rollen. So wurden in der 
Leseforschung verschiedene Faktoren nachgewiesen, die das frühe Lesen ent- 
scheidend beeinflussen. Dabei dominieren auf dieser Entwicklungsstufe Stu- 
dien, die auf Vorläuferfertigkeiten wie die phonologische Bewusstheit, das 
schnelle Benennen und die Rekodiergeschwindigkeit fokussieren, also die for- 
male Seite des Lesens untersuchen. Der Wortschatz - der Abruf und Zuord- 
nung der Wortbedeutung, also die inhaltliche Seite maßgeblich beeinflusst - 
hat beim beginnenden Lesen besonders in der deutschen Leseforschung bisher 
wenig Beachtung erhalten. Dies ist eine empfindliche Lücke, denn etwa ab dem 
dritten Schuljahr, wenn die Anforderungen an das Leseverständnis anspruchs- 
voller werden, wird Wortschatz ein immer wichtigerer Prädiktor für den Lese- 
erfolg (z. B. Biemiller, 2012). Es drängt sich die Frage auf, welche Rolle Wort- 
wissen beim Lesen in den ersten beiden Schuljahren spielt, wenn ein beträchtli- 
cher Teil kognitiver Kapazitäten noch vom Re- und Dekodierungsprozess ab- 
sorbiert ist und die Anforderungen an das Leseverstehen auf einer sehr basalen 
Ebene bleiben. Eben dieser Frage ist das Projekt „Die Entwicklung von Wort- 
schatz und Lesen. Eine Untersuchung auf der Unterstufe“ (2017-2021, kurz: 
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EnWolLe, http://p3.snf.ch/Project-173245) gewidmet. In dieser Längsschnitt- 
studie werden neben der Rekodierfähigkeit und den Vorläuferfertigkeiten ver- 
schiedene Wortschatzaspekte von über 350 Kindern vom 1. bis 3. Schuljahr 
untersucht, um das Zusammenwirken dieser Kompetenzbereiche und ihren 
Einfluss auf das Lesen zu ergründen. Der folgende Beitrag stellt die Auswertung 
der Studiendaten aus dem 1. und 2. Schuljahr vor. 

Für die hier angestrebte differenzierte Auswertung des Zusammenhangs 
von Lesen und Wortschatz ist einerseits zentral, dass im Bereich des Wort- 
schatzes nicht nur - wie dies häufig der Fall ist - exemplarisch der Umfang 
bekannter Wörter erfasst wird, sondern darüber hinaus auch die Tiefe semanti- 
schen Wissens sowie die Verbindungen zwischen Einträgen im mentalen Lexi- 
kon. Ziel dieses Vorgehens ist es, Hinweise darauf zu finden, welche Wort- 
schatzkompetenzen bzw. welche Eigenschaften des mentalen Lexikons sich 
positiv auf das frühe Lesen auswirken. Um der Komplexität des Zusammen- 
spiels der Kompetenzbereiche gerecht zu werden, werden andererseits neben 
dem Wortschatz die erwiesenermaßen gewichtigen Einflussvariablen phonolo- 
gische Bewusstheit und schnelles Benennen sowie die Rekodiergeschwindigkeit 
als Indikator für die Leseflüssigkeit berücksichtigt. 

Diese Komplexität bedingt überdies ein mehrschrittiges statistisches Vorge- 
hen, das verdeutlicht, wie erst durch eine Methodenkombination quer- und 
längsschnittliche Zusammenhänge zwischen Lesen und Wortschatz verlässlich 
sichtbar gemacht werden können. In einem ersten Schritt zeigen die Ergebnisse 
von Korrelationen für die erste bzw. zweite Klasse zeitgleiche Zusammenhänge 
zwischen Lese-, Wortschatz- und Einflussvariablen auf. In einem zweiten 
Schritt wird mittels eines Cross-Lagged-Designs eine längsschnittliche Per- 
spektive eingenommen. Hierbei werden alle Konstrukte zum zweiten auf alle 
Konstrukte zum ersten Erhebungszeitpunkt regressiert, was eine Einschätzung 
der Einflussrichtung unter Berücksichtigung autoregressiver Effekte erlaubt. Da 
diese Modelle jedoch auf starken Verteilungsannahmen beruhen und nicht 
ausgeschlossen werden kann, dass unbeobachtete Merkmale die Zusammen- 
hänge beeinflussen, wird in einem dritten Schritt ein Fixed-Effects Panel-Mo- 
dell gerechnet. Dieses erlaubt die kausale Rückführung der Entwicklung der 
Lesefähigkeiten auf die Veränderungen im Wortschatz, dem schnellen Benen- 
nen und die phonologische Bewusstheit. 


2 _Wortschatzkompetenzen und ihre Erhebung auf der Zielstufe 

Das mentale Lexikon, d. h. derjenige Teil des Langzeitgedächtnisses, in dem das 
Wortwissen gespeichert ist, lässt sich einerseits durch die Zahl der gespeicher- 
ten Worteinträge, d.h. die Wortschatzbreite (vocabulary breadth; entspricht 


dem Wortschatzumfang), andererseits durch die Qualität des Wortwissens, 
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d.h. die Wortschatztiefe (vocabulary depth) charakterisieren (z. B. Anderson 
und Freebody, 1981; Ouellette, 2006; Tannenbaum et al., 2006; Vermeer, 2001). 

Definition und Bedeutung des Wortschatzumfangs sind unumstritten. Ab 
dem Schulalter wird in der Regel ein Wortschatzauszug getestet, für den gemes- 
sen wird, ob die Zielwörter bekannt sind (dichotom bekannt vs. unbekannt). 
Für die Messung des rezeptiven Wortschatzes im Deutschen liegt für das Schul- 
eingangsalter bspw. der aus dem Englischen übersetzte Peabody Picture Voca- 
bulary Test für 3- bis 16-Jährige von Lenhard et al. (2015) vor. 

Wortschatztiefe hingegen wird in der Literatur unterschiedlich ausgelegt 
(z.B. Cain & Oakhill, 2014; Read, 2004). Read (2004, S. 211-212) führt drei 
Möglichkeiten an: erstens die Präzision semantischen Wissens (precision of 
meaning), die Auskunft darüber gibt, wie differenziert semantische Repräsen- 
tationen zu Wörtern im mentalen Lexikon sind. Gemessen wird hier eine gra- 
duelle Abstufung, die von einer vagen Idee bis zur differenzierten Kenntnis der 
Bedeutungen verläuft (im Folgenden: „semantisches Wortwissen“). Weniger 
spezifisch ist die zweite Auslegung von Wortschatztiefe, nämlich das sog. um- 
fassende Wortwissen (comprehensive word knowledge), das ebenfalls semanti- 
sches Wissen, darüber hinaus aber auch phonologisches, orthografisches und 
grammatisches Wissen zu Wörtern beinhaltet. Die dritte Auslegung schließlich 
umfasst Wissen über Verbindungen eines Wortes zu anderen Einträgen im 
mentalen Lexikon (network knowledge), z. B. zu Synonymen, Antonymen und 
Hyperonymen (Read, 2004), das im Folgenden als „relationales Wortwissen“ 
(nach Juska-Bacher & Jakob, 2014) bezeichnet wird. Im hier beschriebenen 
Projekt wird im Bereich der Wortschatztiefe semantisches und relationales 
Wortwissen betrachtet, formales Wortwissen hingegen bleibt - da auf der 
Schuleingangsstufe im Vergleich zu den späteren Primarschuljahren noch von 
geringerer Relevanz (zu grammatischem Wissen siehe Clahsen & Fleischauer, 
2014 und Deacon & Kirby, 2004; orthografisches Wissen wird auf dieser Stufe 
gemäß aktuellem Lehrplan! in der Schweiz in den beiden ersten Klassen kaum 
vermittelt) - unberücksichtigt. 

Während mit dem Wortschatz- und Wortfindungstest WWT 6-10 (Glück, 
2011) im Deutschen ein valides Instrument für die Messung relationalen 
Wortwissens zur Verfügung steht, fehlt ein solches für das semantische Wort- 
wissen. Bisher besteht nicht einmal Einigkeit darüber, wie dieses am besten zu 
erheben ist (Cain & Oakhill, 2014). Häufig wird es in Form von Definitionsauf- 
gaben gemessen (weitere Möglichkeiten siehe Read 2004, S. 212-216), die an- 
hand von Skalen bewertet werden (bspw. Ouellette, 2006 mit 0-3 Punkten). 


1 Erziehungsdirektion des Kantons Bern (2016). Lehrplan 21. Kompetenzaufbau Deutsch. 
1. Zyklus. Verfügbar unter:  https://be.lehrplan.ch/lehrplan_printout.php?k=1&z=1 
&ekalias=0&fb_id=1&f_id=11. 
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Dabei werden dekontextualisierte, abstrakte Definitionen oft höher bepunktet 
als Beispiele und Angaben zur Funktion (Vermeer, 2001). Bei diesem Vorgehen 
besteht die Gefahr, dass nicht nur semantisches Wissen, sondern auch Weltwis- 
sen und die Form der Definition und damit die kognitiven Fähigkeiten des 
Kindes bewertet werden (Kurland & Snow, 1997; Juska-Bacher et al., 2021). Als 
Option steht im Deutschen wie in anderen Sprachen der Teiltest Wortaufgaben 
aus dem IQ-Test des Hamburg-Wechsler-Intelligenztests für Kinder (Petermann 
& Petermann, 2007) zur Verfügung, in dem Probanden Wörter mit steigendem 
Schwierigkeitsgrad definieren sollen. Allerdings ist dieser Test nicht für eine 
detaillierte Messung semantischen Wortwissens konzipiert, sondern für die 
Ermittlung eines Teilwertes des IQs der Testpersonen (zur Problematisierung 
siehe Kapitel Erhebungsinstrumente). 

Da in der internationalen Leseforschung immer wieder Korrelationen zwi- 
schen Wortwissen und Lesen aufgezeigt wurden, die mit zunehmendem Alter 
der Probanden höher wurden (vgl. z.B. Tannenbaum et al., 2006), wird der 
Einbezug des Wortschatzes bereits auf der Primarstufe dringlich gefordert (z. B. 
Ouellette, 2006). Dabei wird angeregt, seine Bedeutung möglichst differenziert 
zu untersuchen, d. h. neben dem Wortschatzumfang Kriterien wie semantisches 
und relationales Wissen einzubeziehen (u. a. Tannenbaum et al., 2006). In die- 
ser Studie wurde für Drittklässler gezeigt, dass Wortschatzumfang und -tiefe 
deutlich unterscheidbare Dimensionen von Wortschatz sind, auch wenn sie 
stark korrelieren (Tannenbaum et al., 2006). 


3 Weitere für das frühe Lesen relevante Faktoren 


Unbestritten in ihrer Relevanz für das frühe Lesen ist eine Reihe weiterer Fakto- 
ren, die deutlich besser erforscht ist als der Wortschatz. Dazu zählen die Vor- 
läuferfertigkeiten phonologische Bewusstheit und schnelles Benennen (rapid 
automatized naming oder RAN) sowie die Rekodiergeschwindigkeit als Indi- 
kator für die Leseflüssigkeit. Besonders am Anfang des Leseerwerbs spielt die 
phonologische Bewusstheit eine zentrale Rolle, wenn die Kinder beim rekodie- 
renden Lesen auf dem indirekten, phonologischen Weg die Wörter erlesen 
(zum Zwei-Wege-Modell siehe Castles & Coltheart, 2004). Ihre Bedeutung 
wurde für eine Reihe von Sprachen eindeutig nachgewiesen, für das Deutsche 
z.B. von Ennemoser et al. (2012), Fricke et al. (2016) und Juska-Bacher et al. 
(2015). Deutlich weniger Beachtung erhielt bisher die Zugriffsgeschwindigkeit 
auf die Wortbedeutung (das schnelle Benennen), die beim Dekodieren eine 
wichtige Rolle spielt. Da ein schneller lexikalischer Zugriff beim Lesen eine 
kognitive Entlastung darstellt, wird in der internationalen Forschung die Be- 
rücksichtigung dieses Faktors postuliert (z. B. Schmitt, 2010). Zur Messung des 
schnellen Benennens erhalten die Probanden die Aufgabe, eine Reihe gleichzei- 


38 


tig präsentierter Stimuli (z. B. Farben) möglichst schnell „vorzulesen“. Den 
wichtigen Einfluss des schnellen Benennens konnten im Deutschen bspw. Stu- 
dien von Ennemoser et al. (2012), Fricke et al. (2016) und Landerl et al. (2019, 
sprachvergleichend) nachweisen. 

Die Rekodiergeschwindigkeit setzt ebenso wie die phonologische Bewusst- 
heit am Rekodierprozess, an der technischen Seite des Lesens an. Gemessen 
wird die Flüssigkeit durch das Lesen von Pseudowörtern, bei denen der Zugriff 
auf eine Wortbedeutung (Dekodieren) ausgespart wird. Der deutliche Einfluss 
der Rekodiergeschwindigkeit auf das verstehende Lesen (im Deutschen bspw. 
belegt von Landerl & Wimmer, 2008; Mayer, 2018), verwundert wenig, stellt 
doch dieser Prozessschritt des Rekodierens besonders am Anfang der Schulzeit 
einen beträchtlichen Anteil der basalen Lesekompetenzen auf der Wort-, Satz- 
und Textebene dar. Flüssiges Lesen entlastet den Leseprozess und setzt damit 
Ressourcen für das Verstehen frei (De Jong & Van der Leij, 2002; Kim et al., 
2011). 


4  Ausgangshypothesen der Studie EnWoLe 


Die Ziele des hier präsentierten Studienausschnitts sind, die Auswirkungen 
eines gefestigten Wortschatzes als Ganzes sowie der Teilbereiche Wortschatz- 
umfang, relationales und semantisches Wortwissen auf das verstehende Lesen 
sowohl zeitgleich als auch longitudinal zu untersuchen. Um diesen Einfluss klar 
von den technischen Lesefähigkeiten abgrenzen zu können, müssen auch die 
Vorläuferfertigkeiten und die Rekodierfähigkeit im statistischen Modell be- 
rücksichtigt werden. Während für Ersteres korrelative Analysen verwendet 
werden, wird Zweiteres mittels längsschnittlicher Kausalanalysen untersucht. 
Ein signifikanter Effekt des Wortschatzes aus dem ersten Schuljahr auf das 
Lesen im zweiten Schuljahr war gemäß den obenstehenden Befunden nicht per 
se zu erwarten, da zu diesem frühen Zeitpunkt der rekodierende Prozess und 
dessen Vorläuferfertigkeit, die phonologische Bewusstheit, eine dominante 
Rolle beim Lesen spielen und die autoregressiven Effekte des Lesens den Wort- 
schatzeinfluss überlagern dürften. Dennoch möchten wir im Folgenden der 
Frage nachgehen, ob Wortschatzkompetenzen nicht doch einen bedeutsamen 
Einfluss auch bereits auf das frühe Lesen haben, insbesondere wenn als abhän- 
gige Variable verstehendes Lesen und damit der dekodierende Teilprozess er- 
hoben wird. Die daraus abzuleitenden Hypothesen bilden den Ausgangspunkt 
der Untersuchung: 
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1) Werden die beiden Zeitpunkte isoliert betrachtet, ist der Einfluss des Wort- 
schatzes auf das verstehende Lesen signifikant. (Querschnittuntersuchung) 

2) Weil die Dekodierfähigkeit gegenüber dem Rekodieren mit steigenden Lese- 
kompetenzen an Bedeutung gewinnt, ist in der zweiten Klasse der Zusam- 
menhang zwischen Wortschatz und verstehendem Lesen größer als in der 
ersten. 

3) Es gibt einen Effekt des Wortschatzes im ersten Schuljahr auf das verstehen- 
de Lesen im zweiten Schuljahr. (Längsschnittuntersuchung) 

4) Dieser Effekt wird möglicherweise nicht direkt sichtbar. Der Nachweis eines 
solchen Effektes bedingt die Anwendung eines geeigneten Datenmodells, 
das die Zunahme der Korrelationen des Wortschatzes mit dem verstehen- 
den Lesen zulässt. 


5 Material und Methoden 


5.1 Stichprobe 


In der Langzeitstudie EnWoLe wurden im Zeitraum von Mitte März bis Ende 
Mai 2018 mit 348 Erstklässlern und im selben Zeitraum im Jahr 2019 mit 361 
Zweitklässlern verschiedene Tests zu Wortschatz- und Lesekompetenzen sowie 
Einflussvariablen durchgeführt. Für die hier vorgestellten Analysen wurden 
ausschließlich Datensätze von Kindern berücksichtigt, von denen vollständige 
Daten beider Erhebungszeitpunkte vorlagen (N = 313 aus 39 Klassen, davon 
179 Mädchen und 134 Jungen mit einem Durchschnittsalter von 7;5 Jahren zu 
tl und 8;5 Jahren zu t2). 27 der Klassen waren aus dem städtischen Bereich, 12 
aus dem ländlichen. Alle Kinder sprachen Deutsch als Erstsprache und wiesen 
keine diagnostizierten Sprachentwicklungsbeeinträchtigungen auf. 


5.2  Erhebungsinstrumente 


Lesekompetenzen wurden anhand des standardisierten und im Deutschen 
gängigen Lesetests ELFE II (Lenhard et al., 2018) erhoben, der das Lesever- 
ständnis von Einzelwörtern, Sätzen und kurzen Texten prüft. 

Im Bereich des Wortschatzumfangs kam der aus dem Englischen übersetzte 
PPVT-4 (Lenhard et al., 2015) zum Einsatz. Abgesehen von den Herausforde- 
rungen, die die Übersetzung eines Testinstruments in sprachlicher wie konzep- 
tioneller Hinsicht mit sich bringt (siehe z. B. Peña, 2007), erforderte die Ver- 
wendung dieses Tests in der Schweiz einige Anpassungen. Dies betraf den Er- 
satz der bundesdeutschen durch Schweizer Varianten, u. a. „Schornstein“ durch 
„Kamin“ und „Umschlag“ durch „Kuvert“. Aus Zeitgründen wurde mit einer 
Testhalbierung gearbeitet (nur ungerade Items). 
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Zur Erfassung des semantischen Wortwissens wurde der Untertest 6 Wort- 
schatztest des HAWIK-IV (Petermann & Petermann, 2007) verwendet. Dieser 
Test kam bereits in verschiedenen anderen Sprachen zur Messung des semanti- 
schen Wortwissens zum Einsatz (z. B. im Englischen bei Cain & Oakhill, 2014, 
im Niederländischen bei Swart et al., 2017, und im Norwegischen bei Rydland 
et al., 2012). In EnWoLe wurde auch dieser Test halbiert (Wortaufgaben 7-35, 
nur die 15 ungeraden Items). Da das dreistufige Bewertungssystem dieses IQ- 
Tests mit 0 bis 2 Punkten? pro Antwort nicht auf einer linguistisch überzeugen- 
den semantischen Analyse der einzelnen Wörter beruht und nur den Mindest- 
differenzierungsgrad fiir eine Beurteilung von semantischem Wortwissen bie- 
tet, wurden in EnWoLe nach einer semantischen Analyse eigene Bewertungs- 
kriterien erarbeitet und die Punkteskala auf 0 bis 3 Punkte erhöht (siehe Juska- 
Bacher et al., in Druck; ebenfalls mit einer vierstufigen Skala hat bspw. Ouel- 
lette, 2006 gearbeitet). Die transkribierten Antworten der Kinder wurden in 
einem ersten Schritt von jeweils zwei unabhangigen Raterinnen beurteilt. Mit 
Cohens Kappa x = 0.79, SD = 0.1, Spannweite 0.6 - 1 war die Interrater-Relia- 
bilität zufriedenstellend. Bei Abweichungen in der Bewertung folgte ein zweiter 
Schritt, in dem eine dritte Raterin die Definitionen unabhängig beurteilte. 

Das relationale Wortwissen schließlich wurde mit der Kurzfassung 2 des 
WWT 6-10 expressiv (Glück, 2011; Items T16 bis 55 für die Zielgruppe von 7 
bis 9 Jahren) bestimmt. In diesem Test geht es u.a. um die Benennung von 
Antonymen und Hyperonymen. Da am Projekt nur erstsprachige Kinder ohne 
diagnostizierte Sprachentwicklungsverzögerungen beteiligt waren, wurde auf 
Abrufhilfen verzichtet. 

Als Kontextvariablen wurden die Rekodiergeschwindigkeit mit einer Auf- 
gabe zum Lesen von Pseudowörtern mit dem SLRT-H (Moll & Landerl, 2014) 
sowie die Vorläuferfertigkeiten phonologische Bewusstheit mit dem BAKO 1-4 
(Stock et al., 2017; Vokalersetzung, Restwortbestimmung und Phonemvertau- 
schung) und schnelles Benennen mit dem TEPHOBE (Mayer, 2016; Teiltests 
Farben, Buchstaben und Zahlen) erhoben. 

Die verwendeten Testinstrumente sind zusammenfassend in Tabelle 1 dar- 
gestellt. 


2 0Punkte werden gemäß Testmanual für eine offensichtlich falsche Antwort vergeben, 
2 Punkte gibt es für ein treffendes Synonym, die Angabe des hauptsächlichen Verwen- 
dungszwecks oder ein Hyperonym. Die übrigen Antworten, die zwar korrekt, aber nicht 
ausreichend sind, werden mit einem Punkt bewertet (Petermann & Petermann, 2007, 
S. 206-207). Diese Vorgaben legen relativ großes Gewicht auf eine dekontextualisierte Form 
der Definition. Die Verwendung von Synonymen und Hyperonymen binden stark den Be- 
reich des relationalen Wortwissens ein, was im Zusammenhang mit der Beurteilung kogni- 
tiver Fähigkeiten des Kindes durchaus legitim ist, bei einer Untersuchung seines semanti- 
schen Wortwissens aber möglichst weitgehend reduziert werden sollte. 
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Tabelle 1: Untersuchte Variablen und die verwendeten Testinstrumente 


Variable Testinstrument 

Lesen 

Wortlesen Lenhard et al. (2018): ELFE Il 

Satzlesen Lenhard et al. (2018): ELFE Il 

Textlesen Lenhard et al. (2018): ELFE Il 

Wortschatz 

Wortschatzumfang Lenhard et al. (2015): PPVT (Testhalbierung) 

Semantisches Wortwissen Petermann & Petermann (2007): WISC-IV (Untertest 6 
Wortschatztest mit Testhalbierung) 

Relationales Wortwissen Glück (2011): WWT (Kurzfassung 2 expressiv) 

Kontextvariablen 

Pseudowörterlesen Moll & Landerl (2014): SLRT-II 

Phonologische Bewusstheit Stock et al. (2017): BAKO (Teiltests Vokalersetzung, 
Restwortbestimmung und Phonemvertauschung) 

Schnelles Benennen Mayer (2016): Tephobe (Teiltests Farben, Buchstaben 
und Zahlen) 


Zu beiden Zeitpunkten wurden mit denselben Kindern dieselben Tests durch- 
geführt. Für eine detailliertere Beschreibung der Tests vgl. Juska-Bacher et al. 
(in Druck). In der ersten Klasse wurden die Daten ausschließlich mit Papierver- 
sionen in Einzeltestungen erhoben, in der zweiten Klasse bildete der ELFE- 
Lesetest (Lenhard et al., 2018) eine Ausnahme, er wurde - da die Kinder nun in 
der Lage waren, leise zu lesen - in Gruppen von bis zu sieben Kindern durch- 
geführt. 


5.3 Auswertungsmethoden 


Um der komplexen Natur der Wortschatzkompetenzen und des Leseverständ- 
nisses sowie deren Entwicklung und gegenseitigem Einfluss gerecht zu werden, 
ist die Wahl der passenden statistischen Modelle zur Auswertung und ihre 
Kombination elementar. Während das Wesen der Wortschatz- und Lesekom- 
petenzen an sich deskriptiv ist und durch Mittelwerte abgebildet wird, sind die 
simultanen Einflüsse der vorliegenden Daten korrelativ und werden entspre- 
chend durch korrelative Analysen bewertet. Die Frage nach der Kausalität im 
Längsschnitt wiederum muss mittels eines linearen Panel-Modells beantwortet 
werden. In Längsschnittstudien mit latenten Konstrukten wird diese Situation 
typischerweise durch sogenannte Cross-Lagged-Designs abgebildet (Mayerl & 
Andersen, 2019; Reinders, 2006). Die Methoden, um ein Cross-Lagged-Design 
zu untersuchen, sind grundsätzlich Partialkorrelationen, Regressionsanalysen 
oder ein Strukturgleichungsmodell. In solchen Modellen werden alle Kon- 
strukte zu t2 auf alle Konstrukte zu tl regressiert. Einschränkend wirkt sich 
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dabei eine allfällige Kollinearität aus, die eine Interpretation der relativen Ver- 
änderung über die Zeit erschwert, was hier der Fall ist. Deshalb wird im Fol- 
genden ein Fixed-Effects-Modell verwendet, das die Veränderung in den Kon- 
strukten frei von unbeobachteter zeitlich konstanter Heterogenität in Verbin- 
dung setzt (Allison, 2009). 


6 Ergebnisse 


6.1 Deskriptive Statistik der Einzelvariablen 


Tabelle 2 enthält die Mittelwerte der einzelnen im Projekt erhobenen Variablen. 
In allen Tests war die Verbesserung der Kinderleistungen zwischen tl und t2 
hochsignifikant. In der Restwortbestimmung trat zu t2 ein Deckeneffekt auf, 
der aber in keiner anderen Variable feststellbar war. 


Tabelle 2: Mittelwerte (Rohwerte) der Einzelvariablen 


1. Klasse 2. Klasse 
wma | me EE] a | me ES] 
wert wert 

Wortlesen 2 56 20.1 | 80 | 11 65 33.5 | 98 
Satzlesen o 27 52 | 41| 2 36 12.9 | 60 
Textlesen o 16 28 | 28 1 24 sa | 47 
pesude: 4 52 20.1 7.7 7 71 30.2 9.3 
wortlesen 
Wortschatz- 90 |197 |142.7 | 193 |100 |211 [155.5 | 19.4 
umfang 
Reiationales 1 36 18.2 | 66 | 4 37 24.2 6.3 
Wortwissen 
Semantisches 

i 2 29 146 | 48] o 32 20.2 | 5.7 
Wortwissen 
RAN Farben? 0.34 | 139 | 079 | 02 | 046 | 214 | 091 | 0.22 
RAN 

0.57 | 2.78 | 1.29 | 033 | 0.69 | 2.78 | 1.64 | 0.37 

Buchstaben? 
RAN Zahlen? 0.61 | 263 | 1.25 | 033 | 0.54 | 2.78 | 157 | 036 
PHB vokal; 0 12 45 3.3 0 12 6.7 3.3 
ersetzung 
PPE REStWON 0 7 44 | 21] 0 7 55 | ı7 
bestimmung 
PHB Phonem- 0 11 4.3 3.6 0 11 7.2 2.9 
vertauschung 


N = 313; ® Der Rohwert ist in Anzahl korrekt benannte Items pro Sekunde angegeben. 
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Zu beiden Zeitpunkten zeigten sich relativ konsistente Zusammenhänge bei 
den Items desselben Konstrukts. Tabelle 3 gibt die bivariaten Pearson-Korrela- 
tionskoeffizienten zwischen den Variablen wieder. 

Während die Korrelationen zwischen den Lese- und den Wortschatz- 
variablen zu tl schwach ausfielen und kaum 0.2 überstiegen, nahm die Stärke 
der Zusammenhänge über die Zeit zu: Zu t2 lagen - mit der Ausnahme des 
Wortschatzumfangs - die Korrelationen über 0.2 und waren oft höher als 0.3. 
Zudem nahmen auch die zu tl kaum vorhandenen Korrelationen der Wort- 
schatzgrößen mit dem RAN und der phonologischen Bewusstheit zu. Dieses 
Muster ist für das semantische Wortwissen am ausgeprägtesten. 

Die hohen Korrelationen der Variablen innerhalb desselben Konstrukts zu 
beiden Zeitpunkten wiesen darauf hin, dass diese mittels einer konfirmatori- 
schen Faktorenanalyse für längsschnittliche Daten zusammengefasst werden 
dürfen (Little, 2013). Da die Normalverteilung teilweise nicht gegeben war, 
wurde ein robustes Maximum Likelihood Verfahren verwendet (Gana & Broc, 
2019) Eine Korrelation zwischen den jeweiligen Konstrukten zu tl und t2 
wurde zugelassen, um die zeitliche Stabilität abzubilden. Tabelle 4 gibt einige 
Maßzahlen zu den vier latenten Konstrukten wieder. 


Tabelle 4: Maßzahlen zu den latenten Konstrukten 


Lesen Phonoloeische RAN Wortschatz 
Bewusstheit 
CFI 0.98 0.98 0.89 0.93 
SRMR 0.03 0.03 0.08 0.05 
R?-Items [0.67 -0.92] [0.46-0.58] [0.35-0.80] [0.32-0.66] 
Alpha (t4, t2) 0.89, 0.92 0.75, 0.73 0.74, 0.75 0.66, 0.70 
Korrelation t1-t2 0.83 0.84 0.79 0.99 


Das Lesen wurde durch die drei Variablen Wort-, Satz- und Textlesen ver- 
gleichsweise gut abgebildet und wies sehr gute Werte beim Modellfit (CFI > 
0.95, SRMR < 0.05), der Dimensionalität (Cronbachs Alpha > 0.8) und der 
erklärten Varianz in den einzelnen Variablen auf (hohe R?-Werte für alle Items 
zu beiden Zeitpunkten). Dies gilt auch für die phonologische Bewusstheit und 
mit Einschränkungen für das schnelle Benennen. Für den Wortschatz fiel das 
Ergebnis hinsichtlich der Dimensionalität und der erklärten Varianz beschei- 
den aus. Wortschatzumfang, relationales und semantisches Wortwissen schie- 
nen nur mäßig auf ein gemeinsames Konstrukt „Wortschatz“ zurückzuführen 
zu sein. Das latente Konstrukt „Wortschatz“ vermochte insbesondere zu tl nur 
rund ein Drittel der Varianz in Wortschatzumfang und semantischem Wort- 
wissen zu erklären. Auf Grund der ansonsten akzeptablen Modellgüte und den 
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theoretischen Uberlegungen wurden die drei Items weiter fiir die Konstruktion 
des Wortschatzes verwendet. 


6.2 Zusammenhang zwischen Wortschatz und Lesen im Längsschnitt 


Zur Klärung der Frage, wie die Entwicklung der Lesefähigkeiten mit dem Wort- 
schatz zusammenhängt, wurden Cross-Lagged-Modelle verwendet, in welchen 
zusätzlich die beiden weiteren Konstrukte, RAN und phonologische Bewusst- 
heit, kontrolliert wurden (Mayerl & Andersen, 2019). In solchen Modellen 
werden alle Konstrukte zu t2 auf alle Konstrukte zu t1 regressiert. Zudem wird 
das Lesen zu t2 auch auf das Pseudowortlesen zu t1 zurückgeführt. Erwartungs- 
gemäß lud das Pseudowortlesen deutlich niedriger auf einem gemeinsamen 
Lesefaktor als die anderen Lese-Items, weshalb es als unabhängiges manifestes 
Merkmal mit in das Modell mitaufgenommen wurde. Abbildung 1 zeigt die 
entsprechenden Resultate, hervorgehobene Koeffizienten sind mindestens auf 
dem 5-%-Signifikanzniveau signifikant, alle Koeffizienten sind standardisiert. 


Abbildung 1: Cross-Lagged-Modell 
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Die Abbildung verdeutlicht, dass die einzelnen Konstrukte zeitlich stabil sind, 
was sich in vergleichbaren standardisierten Ladungen zu t1 und t2 und starken 
autoregressiven Pfaden äussert: Alle Konstrukte zu t1 hatten einen hochsignifi- 
kanten Einfluss auf die entsprechenden Konstrukte zu t2. Vor dem Hinter- 
grund dieser autoregressiven Einflüsse manifestierte sich ein einziger signifi- 
kanter Cross-Lagged-Effekt, der RAN zu t2 wurde weiter durch die Lesefähig- 
keiten zu t1 determiniert. 

Dass keine weiteren Effekte der Konstrukte zu tl auf die Lesefähigkeiten zu 
t2 unter Kontrolle der Lesefähigkeiten zu tl bestanden, vermag auf den ersten 
Blick zu überraschen. Indes zeigt sich einerseits, dass insbesondere beim Lesen 
und beim Wortschatz zu t2 große Varianzanteile durch die jeweiligen Kon- 
strukte zu t1 erklärt werden. Die entsprechenden Anteile belaufen sich auf 69.2 
Prozent beim Lesen und auf 81.7 Prozent beim Wortschatz. Andererseits finden 
sich zwischen dem Lesen und dem Wortschatz wie auch mit der phonologi- 
schen Bewusstheit signifikante Kovarianzen zu beiden Messzeitpunkten (nicht 
gezeigt in Abbildung 1). 

Die Zusammenhänge zwischen Wortschatz und Lesen, die über die gezeig- 
ten Korrelationen hinausgehen, werden veranschaulicht durch die parallele 
Entwicklung der Lese- und Wortschatzkompetenzen. Der vergleichbare, posi- 
tive Koeffizient bedeutet, dass beide Konstrukte einen ähnlichen Zuwachs zwi- 
schen t1 und t2 zu verzeichnen haben. 

Abbildung 2 gibt die paarweisen Vergleiche entsprechender Varianzanaly- 
sen wieder und zeigt den Anstieg in den Lese- wie auch den Wortschatzvariab- 
len zwischen t1 und t2 deutlich, alle Differenzen waren hochsignifikant. 
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Abbildung 2: ANOVA standardisierte Lese- und Wortschatzvariablen 
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Anmerkung: Die Variablen wurden basierend auf den Werten zu t1 mit einem Mittelwert von O und einer 
Standardabweichung von 1 standardisiert. Eine Streuung in den negativen Bereich ist deshalb möglich. 
Die standardisierten Werte bilden die Skalen der y-Achsen in den Einzelgrafiken. 


Im Mittel erhöht sich dabei die Lesekompetenz um 1.87 Punkte bei einer 
mittleren Standardabweichung von 1.47, während der Wortschatz lediglich 0.92 
Punkte dazugewinnt, dies bei einer mittleren Standardabweichung von 1.26. 
Die entsprechenden Mittelwerte zu t2 sind 0.66 (SD = 1) für den Wortschatz- 
umfang, 0.92 (SD = 0.96) für das relationale und 1.16 (SD = 1.81) für das se- 
mantische Wortwissen, bzw. 1.70 (SD = 1.23), 1.89 (SD = 1.46) und 2.00 (SD = 


48 


1.71) für das Wort-, Satz- und Textlesen. Zusammengenommen mit den stei- 
genden Korrelationen (Abbildung 1) übersteuern diese Effekte einen Einfluss 
des Wortschatzes t1 auf das Lesen t2. 

Die Folgen dieser Konstellation werden sichtbar, wenn in einem Fixed-Ef- 
fects-Modell in Tabelle 5 simultane Effekte und die Veränderung in den Kon- 
strukten längsschnittlich und frei von unbeobachteter zeitlich konstanter Hete- 
rogenität miteinander in Bezug gesetzt werden. Erhöht sich der Wortschatz um 
eine Standardabweichung zwischen t1 und t2, so resultiert dies in einer Erhö- 
hung der Lesekompetenz um 0.227 Standardabweichungen, erhöht sich die 
phonologische Bewusstheit um eine Standardabweichung, führt dies zu einer 
zusätzlichen Erhöhung der Lesefähigkeiten um 0.142 Standardabweichungen 
zwischen t1 und t2. 


Tabelle 5: Fixed-Effects-Modelle 


b SE 
Phonologische Bewusstheit 0.142° 0.049 
RAN -0.004 0.046 
Wortschatz 0.227” 0.057 


Hausman Test RE vs. FE: y?(3) = 51.06, p = 0.000 
N = 626 (313/313); *p < 0.05, ** p < 0.01, *** p < 0.001 


7 Diskussion 


7.1 Gesamtbild (Modell) 


Die Resultate legen nahe, dass Fortschritte im Wortschatzbereich die Lesefähig- 
keit sowohl querschnittlich als auch längsschnittlich beeinflussen, dieser Effekt 
aber in den ersten zwei Schuljahren nur indirekt sichtbar wird. So zeigt das 
Cross-Lagged-Modell bis auf eine Ausnahme (das schnelle Benennen zu t2 wird 
durch die Lesefähigkeit zu t1 beeinflusst) ausschließlich autoregressive Effekte, 
das heißt, es zeigen sich nur longitudinale Effekte innerhalb einer Kompetenz- 
gruppe. Betrachtet man hingegen die gegenseitigen Beziehungen der für das 
Lesen relevanten Faktoren jeweils zu einem einzelnen Zeitpunkt, so ergeben 
sich signifikante Zusammenhänge zwischen allen Faktoren. Überaus bedeutsam 
ist die Entwicklung dieser Abhängigkeiten: Insbesondere der Einfluss des Wort- 
schatzes auf das (verstehende) Lesen nimmt prägnant zu, während sich der 
Einfluss des schnellen Benennens und der phonologischen Bewusstheit weit 
weniger verändert. Die Fixed-Effects-Modelle veranschaulichen sehr deutlich, 
wie sich der Effekt des Wortschatzes als Ganzes verstärkt. Diese Zunahme des 
Wortschatz-Effekts auf die Lesefähigkeit während der ersten Schuljahre findet 
sich auch in anderen Studien. Torgesen et al. (1997) wiesen nach Kontrolle des 
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autoregressiven Effekts einen Anstieg der Varianzerklärung des Wortschatzes 
aus der 2. respektive 4. Klasse auf das verstehende Lesen zwischen der 3. und 
der 5. Klasse von 24 auf 43 Prozent aus (ahnlich Bast & Reitsma, 1998, aller- 
dings ohne Kontrolle des autoregressiven Effekts), und auch De Jong & Van der 
Leij (2002) interpretieren ihre Resultate dahingehend, obwohl sie keine sub- 
stantielle Zunahme der Korrelationen zwischen dem verstehenden Lesen und 
dem linguistischen Verständnis (rezeptiver und produktiver Wortschatz, Hör- 
verständnis) fanden, was in der vorliegenden Studie hingegen der Fall ist. 

Eine mögliche Erklärung für den relativ geringen Einfluss des Wortschatzes 
auf das Lesen in der 1. Klasse ist, dass zu diesem Zeitpunkt das verstehende 
Lesen noch wenig entwickelt ist und erst mit zunehmender Dekodierfähigkeit 
an Bedeutung gewinnt (gemäß Biemiller, 2012 in der dritten Klasse). Dafür 
spricht die - im 1. Schuljahr durchaus übliche (z. B. Juska-Bacher et al., 2015) - 
geringe Anzahl Items, die besonders in den Satz- und Textlese-Tests überhaupt 
bearbeitet wurde. Dazu ist anzumerken, dass in der vorliegenden Studie die 
Leseleistung in der 1. Klasse deutlich tiefer liegt als jene der Studie von Fricke et 
al. (2016), während die Leistung in der 2. Klasse ähnlich ausfällt. 

Im Cross-Lagged-Modell ebenfalls nicht signifikant war der längsschnittli- 
che Einfluss der phonologischen Bewusstheit und des schnellen Benennens zu 
tl auf das Leseverständnis zu t2. Diese Resultate entsprechen jenen von De Jong 
& Van der Leij (2002) sowie von Landerl & Wimmer (2008), die über das erste 
Schuljahr hinaus keinen signifikanten Einfluss der phonologischen Fähigkeiten 
auf die Rekodiergeschwindigkeit respektive Leseflüssigkeit fanden, die ihrerseits 
aber den größten Anteil an Varianzaufklärung am späteren Leseverständnis 
hatte. Der Einfluss der phonologischen Bewusstheit und des schnellen Benen- 
nens auf das Leseverständnis ist also indirekt und nimmt - im Falle der pho- 
nologischen Bewusstheit - im Verlauf der ersten Schuljahre stetig ab. 


7.2 Das Konstrukt Lesen 


In anderen Studien wurde die Schwierigkeit der Lesetests an die Schulstufe 
angepasst (z. B. De Jong & Van der Leij, 1999, 2002; Landerl & Wimmer, 2008) 
oder teilweise das rekodierende Lesen in das Konstrukt Lesen miteinbezogen 
(Reese et al., 2010). Die deutlich geringere Ladung des Pseudowortlesens im 
Vergleich zu den Variablen Wort-, Satz- und Textlesen auf den Faktor Lesen 
führte in der hier vorgestellten Studie zum Entscheid, dieses nicht in das Kon- 
strukt Lesen zu integrieren. Dieses Vorgehen entspricht demjenigen der Stu- 
dien von Ouellette (2006) und Swart et al. (2017), in der das Rekodieren anhand 
der Geschwindigkeit und Fehleranzahl beim Vorlesen von Pseudowörtern 
konzeptualisiert und nicht in ein gemeinsames Konstrukt mit dem verstehen- 
den Lesen einbezogen wird. Ein Einbezug der Rekodiergeschwindigkeit in ein 
Gesamt-Lesekonstrukt ist eher heikel. Ennemoser et al. (2012) unterscheiden 
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klar zwischen Lesefliissigkeit, Lesegenauigkeit und Leseverstandnis, wobei im 
ELFE II letzteres im Fokus steht. In diesem Sinne bildet das Konstrukt Lesen 
der vorliegenden Studie ausschließlich das Leseverstandnis ab. 

In den meisten Studien (z. B. De Jong & Van der Leij, 1999, 2002) wird das 
rekodierende Lesen mit dem Vorlesen von Listen mit Wörtern und/oder Pseu- 
dowörtern getestet und als eigenes Konstrukt positioniert, so auch hier. Die 
Entscheidung, in dieser Studie einzig das Pseudowortlesen einzubeziehen, be- 
ruht auf den Erkenntnissen aus der Studie von Verhoeven & Keuning (2018), 
die in einer vergleichenden Studie mit guten Lesern und Kindern, die von Dys- 
lexie betroffen sind, nur für das Pseudowortlesen eine gute Prädiktionskraft 
und Sensitivität für eine mögliche Leseschwäche fanden, nicht aber für das 
isolierte Wortlesen. 


7.3 Einzelne Wortschatzvariablen 


Wenn man die Korrelationen der einzelnen Variablen des Lesens und des 
Wortschatzes zu tl betrachtet, fällt auf, dass sie für das Satz- und das Textlesen 
hoher sind als fiir das Wortlesen, was wiederum die oben beschriebene These 
untermauert, dass der Wortschatz zwar für das verstehende Lesen größerer 
Texteinheiten, weniger aber für das rekodierende Lesen entscheidend ist. Bei 
Kindern, die zu tl bereits in der Lage waren, Sätze und kurze Texte zu lesen, 
zeigt sich ein Zusammenhang mit dem Wortschatz, nicht aber bei jenen, deren 
Lesefähigkeit nur für das Lesen von Wörtern ausreichte. Zu t2 sind die Korre- 
lationen aller Wortschatzvariablen mit dem Lesen deutlich stärker, zu diesem 
Zeitpunkt sind alle Kinder imstande, verstehend auch Sätze und Texte zu lesen. 
Zu beiden Zeitpunkten korrelieren relationales und semantisches Wortwissen, 
analog zu Tannenbaum et al. (2006), stärker mit dem Lesen. Auffällig ist, dass 
die Zunahme der Korrelationsstärke vor allem beim relationalen und semanti- 
schen Wortwissen erfolgte, während der Wortschatzumfang sowohl quer- als 
auch längsschnittlich unterschiedliche Resultate zeitigte. Zu tl waren die Kor- 
relationen mit dem Lesen schwach bis nicht vorhanden (Wortlesen), und auch 
zu t2 waren die Korrelationen klar schwächer als die zwischen relationalem und 
semantischem Wortwissen und Lesen, ein Phänomen, das sich auch in einer 
Teilstudie mit bilingualen Kindern zeigte, wo vor allem das relationale Wort- 
wissen eine hohe Kovarianz mit dem verstehenden Lesen zeigte (Röthlisberger 
et al., in Druck). Förderlich für das verstehende Lesen ist es also nicht nur, 
möglichst viele Wörter zu kennen, sondern besonders auch ein umfangreiches 
semantisches Wissen zu haben und über gute Verknüpfungen zwischen den 
Einträgen im mentalen Lexikon zu verfügen. 

Ein indirekter Einfluss des Wortschatzumfangs über die phonologische Be- 
wusstheit auf das Lesen (Juska-Bacher, 2015; Senechal et al., 2006) konnte in 
der vorliegenden Studie nicht bestätigt werden, obwohl zahlreiche Evidenzen 
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einen positiven Einfluss des Wortschatzes auf die phonologische Bewusstheit 
existieren (z. B. Goswami, 2001; Metsala, 1999). 


8 Konklusion 


Ganz offensichtlich ist der Wortschatz ein komplexes Konstrukt und seine 
Rolle bei der Entwicklung des frühen Lesens alles andere als trivial. Deshalb ist 
es bei der Auswertung sinnvoll, die üblicherweise in Entwicklungsstudien ver- 
wendeten Pfadanalysen um zusätzliche Modelle zu ergänzen. Allerdings bleibt 
die statistische Modellierung solch vielschichtiger Daten über die Zeit hinweg 
eine Herausforderung mit Potential für neue Methoden. 

Potential ist auch vorhanden, was die Messmethoden im Wortschatzbe- 
reich, insbesondere des semantischen Wortwissens, angeht. Bisher besteht we- 
der Einigkeit, wie dieses am besten zu operationalisieren ist, noch nach welchen 
Kriterien - sollte tatsächlich mit Definitionen gearbeitet werden - die Itemaus- 
wahl erfolgen sollte, noch wie die Antworten zuverlässig bewertet werden. Die 
Entwicklung eines Bewertungsrasters mit Antwortmöglichkeiten und deren 
Bepunktung sowie die darauf abgestimmte Bewertung der Definitionen durch 
mehrere Rater und ggf. in mehreren Überarbeitungsschritten sind zeitintensiv 
und sollten nicht als „Nebenprodukte“ in individuellen Projekten entwickelt 
werden. Es erstaunt nicht, dass es bisher (nicht nur) im deutschsprachigen 
Raum kein standardisiertes Testinstrument gibt, es wäre aber für eine differen- 
zierte Untersuchung von Wortschatzkompetenzen umso wünschenswerter. 
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Die Wirksamkeit von Fördermaßnahmen 
zur Leseflüssigkeit in Abhängigkeit von 
Passung, Dosierung und Wiedergabetreue 


Herausforderungen für Forschung und Praxis 


Mareike Ehlert & Elmar Souvignier 


Zusammenfassung: Flüssiges Lesen ist eine wesentliche Voraussetzung für Verständ- 
nisleistungen. Sowohl in Modellen der Lesekompetenz als auch in Förderkonzepten 
wird die Leseflüssigkeit daher als eigenständige Komponente betrachtet. Im Beitrag 
ordnen wir das Konstrukt der Leseflüssigkeit theoretisch ein, skizzieren zentrale Be- 
funde zu wirksamen Fördermaßnahmen und stellen mit dem Programm „Der Lese- 
Sportler“ eine Möglichkeit zur Umsetzung dieser Prinzipien in der Grundschule vor. 
Insgesamt legen empirische Befunde eine hohe Wirksamkeit gezielter Maßnahmen zur 
Förderung der Leseflüssigkeit nahe. Allerdings fallen dabei Effekte in der schulischen 
Praxis niedriger aus als in stärker kontrollierten Settings und sie weisen eine große 
Streuung auf. Vor diesem Hintergrund diskutieren wir anhand dreier Aspekte — 
Passung, Dosierung und Wiedergabetreue -, unter welchen Bedingungen Maßnahmen 
zur Förderung der Leseflüssigkeit ihre Wirksamkeit optimal entfalten. 


Schlüsselwörter: Leseflüssigkeit, differenzierte Leseförderung, Implementation, Evi- 
denzbasierung, Evaluation 


Abstract: Reading fluency is regarded as an essential prerequisite for reading compre- 
hension. Therefore, reading fluency has become a key component in effective reading 
interventions. In this article, we outline pivotal findings of reading fluency research on 
effective measures and present the program “The Reading Sportsperson” as one way 
to implement these principles in elementary schools. Overall, empirical findings 
suggest a high effectiveness of interventions promoting reading fluency. However, it is 
also clear that effect sizes of studies in school practice are generally lower and can vary 
significantly. In light of these ambiguous effects, we review potential factors that may 
moderate the effectiveness of fluency interventions. Specifically, we discuss three 
aspects - fit, dosage, and implementation fidelity — to address the conditions under 
which fluency interventions are effective. 
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1 Einleitung 


Wer Texte verstehen möchte, muss flüssig lesen können. Während sich die 
Forschung zunächst primär auf das Leseverständnis als zentralen Aspekt der 
Lesekompetenz konzentrierte, findet seit Beginn der 2000er Jahre auch die 
Leseflüssigkeit als Schlüsselkompetenz in der Leseforschung und -förderung 
verstärkte Beachtung. Dies illustrieren beispielsweise der Bericht des National 
Reading Panel (NICHD, 2000) und umfassende wissenschaftliche Untersu- 
chungen zur Leseflüssigkeit (z. B. Rosebrock et al., 2017; Fuchs et al., 2001). Die 
Leseflüssigkeit selbst lässt sich, wie schon im Eingang dieses Bandes ausführli- 
cher beschrieben wurde, als Zusammenspiel von vier interdependenten Kom- 
ponenten verstehen (Rosebrock & Nix, 2006, 2011). Diese umfassen (1) die 
Lesegenauigkeit, definiert als Prozentsatz korrekt gelesener Wörter, (2) die 
Automatisierung von Leseprozessen, um kognitive Ressourcen für höhere Ver- 
stehensprozesse nutzen zu können, (3) die Lesegeschwindigkeit, unter der die 
Anzahl der korrekt gelesenen Wörter pro Minute verstanden wird, und 
schließlich (4) die Prosodie zur Hervorhebung zusammengehörender Sinnein- 
heiten auf der Satz- bzw. Textebene. 

Ein empirisches Argument für die Konzeptualisierung der Leseflüssigkeit 
als eigenständige Komponente in der Entwicklung der Lesekompetenz ist ihre 
hohe Aussagekraft als Prädiktor für das Leseverständnis (Gold, 2009; Klicpera 
et al., 1993; Silverman et al., 2013). Analog ist die Leseflüssigkeit als zentraler 
Teilprozess in kognitionspsychologischen Modellen zur Entwicklung der Lese- 
kompetenz zu finden (z.B. Kintsch, 1998; Richter & Christmann, 2002). In 
diesen Modellen wird die Leseflüssigkeit zwischen der Worterkennung und 
dem Leseverständnis platziert, wodurch ihr eine Brückenfunktion zwischen 
diesen beiden Teilkompetenzen zugewiesen wird. Die vermittelnde Rolle der 
Leseflüssigkeit zwischen der Worterkennung und dem Leseverständnis zeigt 
sich beispielsweise in einer Studie von Silverman et al. (2013). Sie stellten fest, 
dass Viertklässlerinnen und Viertklässler, die zwar gut dekodieren, aber noch 
nicht flüssig lesen konnten, schlechter in Leseverständnistests abschnitten als 
diejenigen mit bereits ausgeprägten Fähigkeiten der Leseflüssigkeit. Für die 
Leseförderung bedeuten diese Befunde, dass zunächst hierarchieniedrigere 
Fähigkeiten beherrscht werden sollten, bevor darauf aufbauende Kompetenzen 
wie Verständnisleistungen eingeübt werden können. Entsprechend liegen 
mittlerweile einige effektive Förderprogramme vor, die Lesekompetenz als 
Zusammenspiel der Teilfertigkeiten Worterkennung, Leseflüssigkeit und Lese- 
verständnis konzeptualisieren und passend zum jeweiligen Stand der Leseent- 
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wicklung differenzierte Förderangebote machen (z. B. Bertschi-Kaufmann & 
Hagendorf, 2008; Munser-Kiefer, 2014; Ritter & Scheerer-Neumann, 2009). 


2 Förderung der Leseflüssigkeit 


Zur Beantwortung der Frage, welche Methoden im Spezifischen für die Lese- 
flüssigkeit förderlich sind, liegt eine Vielzahl an empirischen Befunden zur 
Wirksamkeit von Fördermaßnahmen vor, die die Lesegenauigkeit und die Le- 
segeschwindigkeit als zentrale Teilkomponenten fokussieren. Im folgenden 
Abschnitt skizzieren wir empirisch bewährte Methoden zur Förderung der 
Leseflüssigkeit und illustrieren am Beispiel des Förderprogramms „Der Lese- 
Sportler“, wie diese Prinzipien im Leseunterricht der Grundschule praktisch 
umgesetzt werden können. 


2.1  Evidenzbasierte Methoden zur Förderung der Leseflüssigkeit 


Zur Förderung der Lesegenauigkeit und -geschwindigkeit haben sich insbeson- 
dere das silbenbasierte und das laute Lesen zu vielzitierten Klassikern entwi- 
ckelt (NICHD, 2000). Um gezielt die Lesegenauigkeit zu verbessern, werden 
beim silbenbasierten Lesen ganze Wörter in einzelne Silben zerlegt, z. B. durch 
das Einzeichnen von Silbenbögen. Zugrundeliegende Idee ist die automatisierte 
Erkennung orthografischer Repräsentationen (Ehri, 2005). Kindern, die noch 
langsam lesen, fällt es oft schwer, das Schriftbild von Wörtern als Ganzes zu 
erkennen, wodurch Lesefehler auftreten (Müller et al., 2013; Müller & Richter, 
2017). Durch die Erfassung und Einprägung einzelner Silben werden Silben mit 
der Zeit nicht mehr Buchstabe für Buchstabe erlesen, sondern als ganze Ein- 
heiten im Sichtwortschatz abgespeichert. Diese Silbeneinheiten können dann 
leichter zu ganzen Wörtern zusammengezogen werden, wodurch Lesefehler 
sukzessive vermieden werden. Eine systematische Förderung des Erkennens 
von Silben zeigt auch in (quasi-)experimentellen Studien erfolgsversprechende 
Ergebnisse (Müller & Richter, 2017; Müller et al., 2020; Ritter & Scheerer-Neu- 
mann, 2009). So stellten beispielsweise Müller et al. (2020) bei leseschwachen 
Kindern positive Effekte eines silbenbasierten Trainings auf die Fähigkeiten der 
phonologischen Rekodierung, der Worterkennung und sogar auf das textba- 
sierte Leseverständnis fest. 

Ergänzend zum silbenbasierten Lesen haben sich Lautleseverfahren zur För- 
derung der Leseflüssigkeit bewährt. Es wird angenommen, dass sich Leserinnen 
und Leser durch das laute Aussprechen vom buchstabenweisen Lesen lösen und 
das Erkennen ganzer Silben und Wörter einüben. Dabei zeigt sich, dass Schüle- 
rinnen und Schüler insbesondere von solchen Fördermaßnahmen profitieren, 
in denen eine unmittelbare Rückmeldung von Lesefehlern enthalten ist (Top- 
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ping, 1999, 2006). Dies ist z. B. durch Vorlesen in Partnerarbeit möglich, bei 
dem Lesefehler direkt von einer zweiten Person korrigiert werden können. 
Umgesetzt wird dieses Prinzip in der Methode des „Paired Reading“ (Topping, 
1999). Durch das Lernen am Modell eines lesestärkeren Kindes werden Lese- 
tempo und Betonung verbessert und Leserinnen und Leser gewinnen zuneh- 
mend an Sicherheit beim Lesen. Lautleseverfahren mit einer solchen Korrek- 
turkomponente können auch in empirischen Studien positive Effekte auf die 
Leseflüssigkeit aufweisen (Gold et al., 2013; Rosebrock et al., 2010). 

Eine weitere evidenzbasierte Form des Lautleseverfahrens, die bereits im 
einführenden Kapitel dieses Bands näher beschrieben wurde, ist das „Repeated 
Reading“ (Samuels, 1979). Beim Repeated Reading wird derselbe Text wieder- 
holt laut vorgelesen, wodurch Leserinnen und Leser ihren Sichtwortschatz 
erweitern und unbekannte Wörter beim erneuten Lesen schneller wiedererken- 
nen. Die Wirksamkeit des Repeated Reading ist durch eine Vielzahl an Meta- 
analysen und Überblicksarbeiten bestätigt worden (Hattie, 2009; Rosebrock et 
al., 2010; Therrien, 2004), weswegen sie oft als Methode der Wahl zur Förde- 
rung der Leseflüssigkeit herangezogen wird. Im Vergleich zu Kontrollgruppen 
finden sich dabei für Ansätze des wiederholenden lauten Lesens im Mittel mo- 
derate Effekte um d = 0.41 (NICHD, 2000). 

Insgesamt besteht vor dem Hintergrund dieser Befundlage zunächst hinrei- 
chende Evidenz für die Wirksamkeit des silbenbasierten Lesens und von Lautle- 
severfahren zur Förderung von Leseflüssigkeitsprozessen. Gleichzeitig weisen 
die Befunde eine hohe Heterogenität auf. So berichtet Therrien (2004) in seiner 
Metaanalyse zwar von der generellen Wirksamkeit von Repeated-Reading-In- 
terventionen, macht aber auch auf variierende Effekte aufmerksam. Bei Schüle- 
rinnen und Schülern mit Lernschwierigkeiten stellt er eine gemittelte Effekt- 
stärke von d = 0.79 fest, während diese bei Schülerinnen und Schülern ohne 
Lernschwierigkeiten deutlich geringer ausfällt (d = 0.59). Abweichend davon 
stellen Chard et al. (2009) in ihrem Review eine ausbleibende Wirksamkeit von 
Repeated-Reading-Interventionen bei leistungsschwachen Schülerinnen und 
Schülern fest. Sie kommen zu dem Schluss, dass sich wiederholtes Lesen mögli- 
cherweise nicht für alle Schülerinnen und Schüler gleichermaßen anbietet. 
Während also die Ansätze des Repeated Reading und des silbenbasierten Lesens 
generell als Schlüssel zur Entwicklung der Leseflüssigkeit betrachtet werden, 
deuten heterogene Befunde aus Studien in der schulischen Praxis darauf hin, 
dass deren Wirksamkeit möglicherweise von spezifischen Bedingungsfaktoren 
moderiert wird. 
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2.2 Das Lese-Sportler-Programm als Ansatz zur Förderung 
der Leseflüssigkeit 


Auf Basis der vorgestellten Bedingungsmodelle, die die Entwicklung der Lese- 
kompetenz als mehrstufigen Prozess beschreiben, wurde mit dem „Lese-Sport- 
ler“ ein differenziertes Programm zur Förderung der drei zentralen Teilpro- 
zesse der Lesegenauigkeit, der Lesegeschwindigkeit und des Leseverständnisses 
entwickelt (Hebbecker et al., 2020; Kawohl, 2015). Für jeden Teilprozess wer- 
den im Lese-Sportler-Programm Materialien! bereitgestellt, die im Leseunter- 
richt der zweiten bis vierten Klasse eingesetzt werden können. Die drei För- 
dermethoden des Lese-Sportler-Programms sind jeweils nach Sportarten (Sla- 
lom, Sprint und Kanu) benannt. Die Analogie zum Sport verdeutlicht, dass 
auch beim Lesen „Trainingsziele“ nur durch intensives Üben erreicht werden 
können. Die Durchführung der Methoden erfolgt für die Förderung der Lese- 
flüssigkeit (Sprint) und des Leseverständnisses (Kanu) in kooperativer Partner- 
arbeit, indem zwei vergleichbar lesestarke Kinder wechselseitig entweder die 
Rolle des übenden „Sportler-Kindes“ oder die Rolle des Feedback gebenden 
„Trainer-Kindes“ einnehmen. Durch die Rollenwechsel wird ein hohes Maß an 
aktiver Ubungszeit erreicht und die Kinder setzen sich intensiver mit den Me- 
thoden auseinander, wenn sie die anleitende Rolle einnehmen. Beim Lese-Sla- 
lom zur Förderung der Lesegenauigkeit arbeitet hingegen ein leseschwächeres 
Kind mit einem lesestarken Kind zusammen. Hier zeigte sich, dass das Trainer- 
kind bei einer homogenen Zusammensetzung der Paare mit der Erkennung 
und Korrektur von Lesefehlern überfordert war. Entsprechend trainiert in die- 
ser Methode ein lesestärkeres Trainer-Kind mit einem leseschwächeren Sport- 
ler-Kind zusammen. Um Lehrkräften eine noch weitergehende Form der Diffe- 
renzierung im Leseunterricht zu ermöglichen, sind die drei Methoden jeweils in 
sechs Schwierigkeitsstufen untergliedert. Die Schwierigkeitsstufen unterschei- 
den sich z.B. in der sprachlichen Ebene (Wort- oder Textebene) und dem 
Schwierigkeitsgrad der Wörter (Frequenz, Anzahl der Silben). Im Folgenden 
stellen wir Ziele und Ablauf zweier Methoden, Lese-Slalom und Lese-Sprint, 
genauer vor, da diese gezielt Leseflüssigkeitsprozesse fördern. Der Aufbau und 
die theoretischen Prinzipien des Lese-Sportler-Programms sind in Tabelle 1 
zusammenfassend dargestellt. 


1 Das Lese-Sportler-Material ist unter folgendem Link frei verfügbar: https://go.wwu.de/ 
di2download. 
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Tabelle 1: Aufbau des Lese-Sportler-Programms 


Lese-Slalom Lese-Sprint Lese-Kanu 


Förderziel Lesegenauigkeit Lesegeschwindigkeit Leseverständnis 

Inhaltlicher Silbenbasiertes Lesen: | Wiederholtes Lautes Strategieorientiertes 

Fokus Einzeichnen von Sil- Lesen: Wortlisten und |Lesen: Organisations- 
benbögen und fehler- |Texte zweimal so und Elaborations- 
freies lautes Vorlesen |schnell und so genau strategien anwenden 
(Paired Reading) wie möglich lesen und Fragen zum Text 

(Repeated Reading) beantworten 
(Reciprocal Teaching) 

Zusammenset- | heterogen: homogen: 

zung der Lese- | Ein lesestärkeres Trai- | Die beiden Kinder wechseln sich in der Rolle des 

paare ner-Kind unterstützt übenden Sportler-Kindes und des anleitenden 
das Sportler-Kind. Trainer-Kindes ab. 


cc-by-nc 4.0 Arbeitseinheit Diagnostik und Evaluation im schulischen Kontext / Universität Münster) 


Zur Förderung der Lesegenauigkeit werden die Prinzipien des silbenbasierten 
Lesens und des Paired Reading mit dem „Lese-Slalom“ umgesetzt. Ziel bei der 
Methode des Lese-Slaloms ist es, eine Liste von Wörtern fehlerfrei vorzulesen. 
Ein lesestarkes Trainer-Kind und ein leseschwächeres Sportler-Kind arbeiten 
dabei in Partnerarbeit. Während das Trainer-Kind eine Liste von Wörtern 
langsam und laut vorliest, zeichnet das Sportler-Kind Silbenbögen unter den 
Wörtern ein. In Anlehnung an das Prinzip des Paired Reading lesen anschlie- 
ßend beide Kinder die Wortliste gemeinsam laut vor. Fühlt sich das Sportler- 
Kind beim Lesen sicher, kann es ein Allein-Lese-Signal geben (z. B. durch ein 
Klopfen auf den Tisch) und alleine weiterlesen. Lesefehler werden, sofern sie 
nicht selbst vom Sportler-Kind verbessert werden, durch das Trainer-Kind 
korrigiert. Dadurch wird im Sinne des Paired-Reading-Ansatzes sichergestellt, 
dass nicht flüchtig über Fehler hinweggelesen werden kann. 

Zur Förderung der Lesegeschwindigkeit wird beim „Lese-Sprint“ die Me- 
thode des Repeated Reading angewandt. Ziel beim „Lese-Sprint“ ist es, mög- 
lichst viele Wörter einer Liste bzw. eines Textes innerhalb einer Minute korrekt 
vorzulesen. Dabei arbeiten zwei ähnlich lesestarke Schülerinnen und Schüler in 
Partnerarbeit. Während das Sportler-Kind vorliest, markiert das Trainer-Kind 
Lesefehler und die Anzahl der gelesenen Wörter pro Minute. Nach dem zweiten 
Vorlesen desselben Textes werden die Rollen getauscht. In aller Regel werden 
bereits beim zweiten Durchlauf mehr Wörter gelesen, weniger Lesefehler ge- 
macht und es entstehen unmittelbare Erfolgserlebnisse. Neben den beiden 
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Methoden des „Lese-Slalom“ und des „Lese-Sprint“, mit denen die Leseflüssig- 
keit gefördert wird, wird beim Lese-Sportler zudem die Methode des „Lese- 
Kanu“ zur Förderung des Leseverständnisses angeboten. Das „Lese-Kanu“ 
orientiert sich an Prinzipien strategieorientierter Förderung, wie sie beispiels- 
weise bei der Methode des „Reciprocal Teaching“ (Palincsar & Brown, 1984) 
umgesetzt werden. 

Zur Wirksamkeit des Lese-Sportler-Programms gibt es mittlerweile mehrere 
längsschnittliche Studien aus der schulischen Praxis (für eine Studienübersicht 
s. Hebbecker et al., 2020). Kawohl (2015) konstatiert nach einem Schuljahr 
positive Effekte des Lese-Sportlers auf die Leseflüssigkeit für Kinder der dritten 
und vierten Klasse (d = 0.20; N = 110). In einigen Studien zeigen sich jedoch 
keine direkten Effekte der Fördermaßnahmen auf die Leseleistungen der Schü- 
lerinnen und Schüler (Hebbecker & Souvignier, 2018; Peters et al., 2021). So 
berichten Peters et al. (2021) bei der Auswertung von sechs Interventionsstu- 
dien keine signifikant positiven Effekte einer kombinierten Förderung beste- 
hend aus einer Lernverlaufsdiagnostik und dem Lese-Sportler auf die Leseleis- 
tungen und -motivation leseschwacher Schülerinnen und Schüler im Vergleich 
zur Kontrollgruppe (N = 1346 Schülerinnen und Schüler aus 264 Klassen). 
Ähnlich wie dies bei dem Forschungsüberblick in Abschnitt 2.1 deutlich wurde, 
fallen also auch die Befunde zum Lese-Sportler-Programm heterogen aus. 


3 Wirksamkeitsbedingungen von Maßnahmen zur Förderung 
der Leseflüssigkeit 


Bei der praktischen Umsetzung prinzipiell wirksamer Fördermethoden im 
schulischen Alltag liegen mitunter deutlich geringere Effekte als in kontrollier- 
ten Interventionsstudien vor (vgl. auch Slavin et al., 2008). Dabei legt auch die 
vorgefundene Heterogenität der Effekte nahe, die Frage nach der Wirksamkeit 
von Maßnahmen vor dem Hintergrund zu betrachten, wie die Programme zur 
Förderung von Leseflüssigkeit in der schulischen Praxis konkret umgesetzt 
werden (Schneider & Randel, 2009). In den folgenden Abschnitten fokussieren 
wir daher drei Faktoren, die die Wirksamkeit von Maßnahmen zur Förderung 
der Leseflüssigkeit potenziell moderieren können. Zunächst diskutieren wir mit 
Rückgriff auf das Prinzip der Passung, welche Eigenschaften der Lernenden 
eine Voraussetzung dafür darstellen, dass sie von Maßnahmen zur Förderung 
der Leseflüssigkeit profitieren und welche Chancen sich durch diagnosebasierte 
Förderentscheidungen ergeben. Zweitens thematisieren wir mit dem Aspekt der 
Dosierung ein Merkmal, das bislang eher wenig Beachtung in der Literatur 
findet. Wir diskutieren, wie Dosierung konzeptualisiert und erfasst werden 
kann und beschreiben, welchen Einfluss die Dosierung von Fördermaßnahmen 
auf die Wirksamkeit der Intervention haben kann. Abschließend erörtern wir 
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anhand des Konzepts der Wiedergabetreue den Einfluss der Programmanwen- 
dung durch die Lehrkraft auf die Wirksamkeit der Fördermaßnahme und skiz- 
zieren die eher uneinheitlichen Befunde zum Zusammenhang von Wiederga- 
betreue und Schülerleistungen. 


3.1 Passung 


Die Entwicklung der Lesekompetenz wird durch eine Vielzahl an kognitiven, 
motivationalen und kontextuellen Faktoren beeinflusst. Entsprechend fallen die 
Vorläuferfähigkeiten und die frühen Lesefähigkeiten von Grundschülerinnen 
und Grundschülern bereits bei Schuleintritt sehr unterschiedlich aus (Frith, 
1986; NICHD, 2000). Dass diese Heterogenität auch am Ende der Grundschul- 
zeit persistiert, wird beispielsweise in den Ergebnissen der IGLU-Studie deut- 
lich: So fiel die Leistungsstreuung bei deutschen Schülerinnen und Schülern der 
vierten Klasse im internationalen Vergleich besonders hoch aus (Hussmann et 
al., 2017). Pierce et al. (2007) identifizierten unter leseschwachen Kindern der 
zweiten und dritten Klassenstufe vier verschiedene Gruppen, die beim Lesen 
unterschiedliche Leistungsmuster aufwiesen. Cluster 1 erzielte unterdurch- 
schnittliche Werte in der Worterkennung und der Lesegenauigkeit, aber durch- 
schnittliche Werte im Wortschatz und im Dekodieren. In Cluster 2 lagen die 
Leistungen bei der Worterkennung und im Wortschatz noch niedriger, wäh- 
rend die Fähigkeiten der Lesegenauigkeit und des Dekodierens unauffällig aus- 
fielen. Cluster 3 zeigte, ähnlich wie Cluster 1, unterdurchschnittliche Werte in 
der Worterkennung und der Lesegenauigkeit, aber deutlich niedrigere Fähig- 
keiten im Wortschatz. Cluster 4 zeigte schließlich in allen vier Bereichen 
Schwächen. Vor dem Hintergrund dieser unterschiedlichen Leistungsmuster 
argumentieren Pierce et al. (2007), dass diese vier Gruppen jeweils eigene För- 
derbedürfnisse haben, sodass Methoden zur Leseförderung vermutlich nicht bei 
allen Kindern in gleicher Weise funktionieren. Um die individuellen Lern- 
stände und -entwicklungen der Schülerinnen und Schüler zu berücksichtigen, 
wird in einigen Interventionen explizit das Prinzip der Passung zum Untersu- 
chungsgegenstand gemacht (Bernard et al., 2019; Connor, 2019). Dabei zeigte 
sich, dass sich die Leistungen der Schülerinnen und Schüler insbesondere dann 
verbessern, wenn eine enge Passung zwischen dem Lernstand der Kinder und 
der eingesetzten Fördermethode bzw. der Schwierigkeit eingesetzter Texte ge- 
geben war. Wie hoch die Effekte prinzipiell wirksamer Methoden wie silbenba- 
siertes oder wiederholtes Lesen ausfallen, scheint also davon abzuhängen, wie 
passend sie für die individuellen Lernvoraussetzungen eines Kindes sind. Im 
Folgenden sollen einige Befunde zu der Frage vorgestellt werden, welche kon- 
kreten Merkmale der Lernenden eine Voraussetzung für die Wirksamkeit die- 
ser Methoden darstellen. 
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Karageorgos et al. (2019) untersuchten differentielle Effekte individueller 
Lernvoraussetzungen von Leserinnen und Leser auf die Wirksamkeit einer 
Intervention zum Wortlesen. Die Befunde legen nahe, dass Effekte auf die Lese- 
geschwindigkeit davon abhangen, ob die Viertklasslerinnen und Viertklassler 
bereits über grundlegende Fähigkeiten der Lesegenauigkeit verfügen. Damit 
konnten Karageorgos et al. (2019) Befunde einer ähnlich angelegten Studie aus 
Dänemark replizieren (Poulsen et al., 2015). Auch Fuchs et al. (2021) wiesen 
Moderatoreffekte von Fähigkeiten der phonologischen Bewusstheit auf die 
Wirksamkeit des Repeated Reading nach. Sie verglichen den Lernzuwachs von 
Schülerinnen und Schülern, die anhand kooperativer, silbenbasierter Lautlese- 
verfahren - mit und ohne Repeated-Reading-Komponente - die Worterken- 
nung und die Leseflüssigkeit trainierten, mit einer Kontrollgruppe. Dabei zeig- 
ten sich in beiden Experimentalgruppen stärkere Effekte der Trainings auf die 
Entwicklung der phonologischen Bewusstheit und der Worterkennung für 
diejenigen Schülerinnen und Schüler, die vor der Intervention geringe Fähig- 
keiten der phonologischen Bewusstheit aufwiesen. Gleichzeitig wird beim Ver- 
gleich der beiden Interventionen deutlich, dass die leistungsschwächeren Schü- 
lerinnen und Schüler ohne Repeated Reading-Komponente einen stärkeren 
Lernzuwachs erreichten. Diese differentiellen Effekte stehen in Einklang mit 
den Befunden von Chard et al. (2009), dass die Methode des Repeated Reading 
nicht die Methode der Wahl für die leseschwächsten Schülerinnen und Schüler 
sein sollte. So resümieren Fuchs et al. (2021): „If teachers are most concerned 
about their weaker readers, then adoption of [a] program that emphasizes PA 
[phonological awareness] and word recognition makes sense.“ (S. 18). Eine 
zentrale Schlussfolgerung dieser Studienergebnisse für die Leseförderung in der 
unterrichtlichen Praxis ist die Notwendigkeit einer stärkeren Differenzierung: 
Leserinnen und Leser, die noch viele Fehler machen, sollten zunächst mit Me- 
thoden zur Förderung der Lesegenauigkeit trainieren, also z. B. mit dem Ansatz 
des silbenbasierten Lesens. Umgekehrt sollten für Leserinnen und Leser, die 
schon genau, aber noch nicht angemessen schnell lesen, Maßnahmen zur För- 
derung der Lesegeschwindigkeit wie das Repeated Reading angeboten werden. 

Um Entscheidungen über solchermaßen passende Förderangebote machen 
zu können, ist eine Diagnose des Lernstands bei Schülerinnen und Schülern 
eine Voraussetzung. Als beispielgebend dafür können die Arbeiten von Connor 
(2019) gelten, in deren Arbeitsgruppe das Online-Tool „Assessment-to-In- 
struction“ (A2i) entwickelt wurde. A2i stellt Lehrkräften diagnostische Infor- 
mationen über die Lesefertigkeiten ihrer Schülerinnen und Schüler zur Verfü- 
gung und verknüpft diese mit Empfehlungen zu passenden - differenzierten - 
Förderangeboten. Die Ergebnisse aus sieben Kontrollgruppenstudien weisen 
darauf hin, dass sich die Leistungen derjenigen Schülerinnen und Schüler in- 
nerhalb eines Schuljahres signifikant verbesserten (d = 0.2-0.4), deren Lehr- 
kräften diagnostische Informationen durch das Online-Tool A2i zur Verfügung 
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standen. Diese Effekte kumulieren sich im Verlauf von der ersten bis zur dritten 
Klassenstufe zu einer Effektstärke von d = 0.7 (Connor, 2019). Im sonderpäda- 
gogischen Kontext wurden bereits seit den 1980er Jahren Untersuchungen zur 
Wirksamkeit einer Kombination aus Lernverlaufsdiagnostik und an Lernstand 
und Leistungsentwicklung von Kindern angepasster Förderung durchgeführt 
(für einen Überblick s. Stecker et al., 2005). Positive Effekte einer passgenauen 
Förderung unterstreichen auch hier, wie sinnvoll ein gezieltes Zusammenspiel 
aus Diagnose und Förderung ist. 

Auch bei dem Lese-Sportler-Programm wird eine solche Kombination aus 
differenziertem Fördermaterial und einer begleitenden Diagnostik realisiert. 
Dazu wird die internetbasierte Lernverlaufsdiagnostik „quop“ genutzt (Sou- 
vignier et al., 2021). Bei diesem diagnostischen Ansatz bearbeiten die Schüle- 
rinnen und Schüler alle drei Wochen einen zehnminütigen Lesetest am Com- 
puter, bei dem die drei Teilkompetenzen Lesegenauigkeit, Lesegeschwindigkeit, 
Leseverständnis erfasst werden. Anhand der Testergebnisse wird unmittelbar 
eine Rückmeldung gegeben, welcher Aspekt der Lesekompetenz im Fokus der 
Förderung eines Kindes stehen sollte. Aufgrund des kontinuierlichen Wechsel- 
spiels zwischen Förderung und Diagnose wird zudem kurzfristig festgestellt, ob 
Anpassungen im Hinblick auf die gewählte Fördermethode angezeigt sind. 
Aktuelle Studien zur Implementation dieses Ansatzes zeigen, dass die Kombi- 
nation aus dem „Lese-Sportler“ mit der Lernverlaufsdiagnostik „quop“ sich 
prinzipiell in der schulischen Praxis umsetzen lässt (Förster et al., 2018; 
Hebbecker & Souvignier, 2018; Souvignier et al., 2016). Befragungen der Lehr- 
kräfte weisen allerdings auch darauf hin, dass die Implementation eine Ver- 
änderung unterrichtlicher Routinen erfordert. 

Dass eine hohe Passung zwischen individuellem Lernstand des Kindes und 
angebotener Fördermaßnahme entscheidend für die Wirksamkeit von Förder- 
maßnahmen ist, ist zunächst wenig überraschend. Für Maßnahmen zur Förde- 
rung der Leseflüssigkeit bedeutet das, dass sie idealerweise dann zum Einsatz 
kommen sollten, wenn Kinder hinreichend genau lesen können, Verbesserun- 
gen hinsichtlich der Leseflüssigkeit aber noch nötig sind, um Prozesse sinnent- 
nehmenden Lesens erleichtern zu können. Diagnostische Informationen stellen 
dabei für Lehrkräfte eine objektive Entscheidungsgrundlage dar, um individuell 
passende Methoden auszuwählen. Eine für den schulischen Alltag praktikable 
Methode ist dabei die Implementation computerbasierten Assessments. Aus 
einer Forschungsperspektive ist festzuhalten, dass weiterer Bedarf an Modera- 
toranalysen zu Merkmalen von Lernenden besteht, um eine optimale Passung 
zwischen Förderangeboten zur Leseflüssigkeit und individuellen Lernvoraus- 
setzungen ausmachen zu können (Fuchs & Fuchs, 2019). 
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3.2 Dosierung 


Die Dosierung - im Sinne des aufgewendeten Umfangs, in dem Leserinnen und 
Leser trainieren - ist ein zweiter potenzieller Einflussfaktor auf die Wirksam- 
keit. Bereits die Gedächtnisexperimente von Ebbinghaus (1885) wiesen auf den 
Wert höherer Lernzeit hin und auch Snoddy (1926) identifizierte mit seinem 
„Power Law of Practice“ einen Lernkurveneffekt: Die Reaktionszeit für die 
Bearbeitung von Aufgaben nahm linear mit der Anzahl durchgeführter Versu- 
che ab. In ähnlicher Weise stellten Ericsson et al. (1993) beim Vergleich von 
professionellen Musikerinnen und Musikern mit Hobby-Musizierenden resü- 
mierend fest, dass die Hochleistungen der Expertinnen und Experten vielmehr 
das Ergebnis intensiven Übens als angeborenen Talents sind. 

Als Operationalisierung für die Dosierung von Interventionen zur Leseför- 
derung liegt es nahe, Angaben zum zeitlichen Umfang entsprechender Pro- 
gramme zu erheben (Hammerschmidt-Snidarich et al., 2019; Torgesen, 1998). 
Bei einem Großteil der Studien zur Wirksamkeit von Fördermaßnahmen der 
Leseflüssigkeit wird die Dosierung in diesem Sinne erfasst (Maki et al., in 
Druck). Alternativ bzw. ergänzend dazu schlagen Hammerschmidt-Snidarich et 
al. (2019) vor, die Dosierung anhand der Anzahl gelesener Wörter zu erfassen. 
Die Unterschiede zwischen der Konzeptualisierung der Dosierung über die 
Lesezeit oder die Lesemenge liegen auf der Hand: Schnellere Leserinnen und 
Leser lesen in der gleichen Zeit mehr Wörter als langsamere Leserinnen und 
Leser. Tatsächlich beobachteten Hammerschmidt-Snidarich et al. (2018), dass 
lesestarke Kinder bei der Durchführung eines Repeated-Reading-Trainings 
mehr als doppelt so viele Wörter lasen wie leseschwächere Kinder, wenn die 
Kinder an der gleichen Anzahl an Sitzungen teilnahmen. Dass die Konzeptuali- 
sierung von Dosierung Konsequenzen für die Interpretation der Effekte in 
Interventionsstudien haben kann, illustrieren Hammerschmidt-Snidarich et al. 
(2019) in ihrer Studie zum Wirksamkeitsvergleich von Repeated Reading und 
Continuous Reading, dem Lesen vieler, aber verschiedener Texte. Dabei erfass- 
ten sie als Dosierungsmaße sowohl die Trainingszeit als auch die Anzahl der 
gelesenen Wörter. Unter der Bedingung, dass langsamere und schnellere Lese- 
rinnen gleich viele Wörter lasen, fielen die Trainingseffekte vergleichbar aus. 
Bei identischer Förderzeit erzielten leistungsstärkere Kinder hingegen höhere 
Leistungszuwächse im Lesen. Diese Befunde verdeutlichen, dass eine Operatio- 
nalisierung der Dosierung über die reine Übungszeit potenziell damit einher- 
geht, dass sich interindividuelle Leistungsunterschiede vergrößern (Matthäus- 
effekt, Stanovich, 2009). Im Hinblick auf das in Abschnitt 3.1. vorgeschlagene 
Ziel einer hohen Passung läge es daher nahe, leseschwächeren Kindern bezüg- 
lich des Übungsumfangs intensivere Angebote zur Verfügung zu stellen, was 
z.B. im Rahmen von zusätzlichen Förderstunden realisiert werden könnte 
(Snidarich, 2015). 


66 


Gleichzeitig wird bei der Suche nach verfügbaren Studien zur Dosierung 
auch ein Mangel an empirischer Evidenz deutlich. In einem aktuellen meta- 
analytischen Review werteten Maki et al. (in Druck) mehrere Interventionsstu- 
dien zur Förderung der Leseflüssigkeit aus. Generell stellten sie hier eine hohe 
Wirksamkeit fest (d = 0.44). Angaben zur Dosierung der Fördermaßnahme 
wurden allerdings nur in fünf Studien erfasst - jeweils operationalisiert über die 
Lesezeit. Keine Studie untersuchte direkte Effekte der Menge gelesener Texte 
auf die Lernleistungen der Schülerinnen und Schüler. Jenseits der differenzier- 
ten Befunde von Hammerschmidt-Snidarich et al. (2019) zur Bedeutung des 
konkreten Umfangs gelesener Texte spricht mit Blick auf die Studienlage den- 
noch vieles für den Einfluss der Übungszeit auf die Wirksamkeit von Förder- 
maßnahmen. Demzufolge ist ein möglichst hohes Maß an Übungszeit anzu- 
streben. Entsprechend sind vorliegende Interventionen zur Förderung der Le- 
seflüssigkeit in aller Regel als zeitintensive Maßnahmen konzipiert. So wird 
beim Lese-Sportler-Programm ein Übungsumfang von 20 Minuten an drei 
Tagen pro Woche empfohlen. In ähnlicher Weise sollen Schülerinnen und 
Schüler bei anderen Förderprogrammen im Laufe eines Schuljahres zwischen 
18 Sitzungen (Ritter & Scheerer-Neumann, 2009) und ca. 40 Sitzungen (Ro- 
sebrock et al., 2010) mit den Materialien arbeiten. Bislang mangelt es allerdings 
an Studien zu der Frage, welchen Effekt solche konkreten Empfehlungen zur 
Dosierung auf die Lernleistungen haben. Die Annahme liegt nahe, dass es hin- 
sichtlich des Übungsumfangs einen abnehmenden Grenznutzen gibt, bei dem 
die Grundregel „je mehr, desto besser“ ab einem bestimmten Zeitpunkt nicht 
länger gilt. Dennoch: Betrachtet man die geringe Anzahl an Minuten, die Lehr- 
kräfte laut Selbstauskünften in einer Woche für den Leseunterricht aufwenden 
(136 Minuten, internationaler Mittelwert: 160 Minuten, vgl. Hussmann et al., 
2017, S. 280), so erscheint eine Intensivierung in jedem Falle erforderlich, zu- 
mal davon ausgegangen werden kann, dass evidenzbasierte Methoden im Re- 
gelunterricht eher selten zum Einsatz kommen (Philipp, 2014). 

Insgesamt wird deutlich, dass nicht nur eine hohe Passung zwischen dem 
individuellen Lernstand und der Fördermethode, sondern auch eine individuell 
angemessene Dosierung im Hinblick auf die Intensität von Förderprogrammen 
wichtig für die optimale Entwicklung der Lesekompetenz ist. Forschungsseitig 
besteht ein erheblicher Bedarf an Studien, die sich dem Thema der Dosierung 
explizit widmen. Dabei müssten verschiedene Interventionskomponenten unter 
Bedingungen verglichen werden, bei denen die Dosierung sowohl als Lesezeit 
als auch als Anzahl der gelesenen Wörter gemessen wird (Hammerschmidt- 
Snidarich et al., 2019). 
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3.3 Wiedergabetreue 


Mit den in Abschnitt 2 vorgestellten evidenzbasierten Methoden wirksamer 
Leseförderung und dem Lese-Sportler-Programm werden konkrete Vorge- 
hensweisen für eine wirksame Förderung der Leseflüssigkeit beschrieben. Es 
scheint naheliegend, dass von einer Wirksamkeit solcher konkreten Methoden 
und Programme nur dann ausgegangen werden kann, wenn sie mit einem ho- 
hen Maß an Wiedergabetreue (fidelity) umgesetzt werden (Noell, 2014). Im 
Umkehrschluss bedeutet das, dass sich heterogene Befunde zur Wirksamkeit 
solcher Fördermaßnahmen möglicherweise durch Unterschiede hinsichtlich 
der Wiedergabetreue erklären lassen. 

Das Konstrukt der Wiedergabetreue selbst, entsprechende Messansätze und 
auch die Variablenkonstruktion weisen eine große Vielfalt auf (Dane & Schnei- 
der, 1998). So werden mit den Begriffen treatment integrity (Yeaton & Sechrest, 
1981), treatment fidelity (Moncher & Prinz, 1991) und implementation fidelity 
(O’Donnell, 2008) Nuancierungen vorgenommen, die allerdings nicht einheit- 
lich verwendet werden (für einen Überblick s. Swanson et al., 2013; Dusenbury 
et al., 2003). Weitgehender Konsens besteht mit Blick auf die von Dane und 
Schneider (1998) vorgenommene Unterscheidung von fünf Facetten der Wie- 
dergabetreue: 1. „adherence“ (Genauigkeit, mit der die Kernelemente eines Pro- 
gramms umgesetzt werden), 2. „dosage“ (Häufigkeit und Dauer der Teilnah- 
me), 3. „quality of delivery“ (Qualität der Umsetzung), 4. „participant respon- 
siveness“ (Beteiligung und Engagement der Teilnehmenden) und 5. „program 
differentiation“ (Differenziertheit des Programms und Unterschiedlichkeit des 
Programms zu ‚Business-as-usual‘-Settings). Während beispielsweise der As- 
pekt der „adherence“ die Perspektive einer präzisen Umsetzung vorgegebener 
Programminhalte in den Fokus nimmt, betont „participant responsiveness“, 
dass eine hohe Wiedergabetreue auch dann vorliegen kann, wenn situations- 
angemessene Anpassungen vorgenommen werden. Gerade mit Blick auf die 
schulische Praxis wird die Uneinheitlichkeit des Konstrukts der Wiedergabe- 
treue deutlich: Wenn eine Innovation gemäß ihrer Konzeption in der unter- 
richtlichen Praxis umgesetzt wird (Mihalic, 2004; O’Donnell, 2008), dann kann 
das bedeuten, dass zentrale Wirkprinzipien in einer an den individuellen Be- 
dürfnissen der Schülerinnen und Schüler angepassten Weise vermittelt werden. 
Es ist aber auch denkbar, nur dann von einer hohen Wiedergabetreue zu spre- 
chen, wenn Maßnahmen im Hinblick auf Ablauf und Umfang exakt konkreten 
Vorgaben entsprechen. Forschungsseitig findet sich vor allem eine Orientie- 
rung an der Frage, ob konkrete Vorgaben (Inhalte, Dosierung) umgesetzt wur- 
den. Während Fragen zu einer angemessenen Adaptivität oder Qualität bei der 
Durchführung von Maßnahmen Interpretationsspielräume (und damit poten- 
ziell Einbußen hinsichtlich der Beurteilerübereinstimmung) mit sich bringen, 
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führt ein Vergleich zwischen konkreten Soll- und Ist-Werten typischerweise zu 
reliableren Ergebnissen (O’Donnell, 2008). 

Konkret liegen einzelne Befunde zum Zusammenhang zwischen der Wie- 
dergabetreue und dem Lernzuwachs der Schülerinnen und Schüler vor. So stellt 
Kuhn (2018) für die Sekundarstufe fest, dass sich ein Teil der Varianz zwischen 
Klassen, die das gleiche Treatment erhielten, durch Unterschiede in der Wie- 
dergabetreue, also z. B. durch einen unterschiedlichen Umfang in der Durch- 
führung der Interventionsmaßnahmen erklären ließ. Ähnliche Befunde be- 
richten auch Vadasy und Sanders (2009) für Grundschülerinnen und Grund- 
schüler. Je mehr sich die Lehrkräfte am empfohlenen Durchführungsumfang 
und an den Vorgaben des Handbuchs zur Durchführung einer Repeated-Rea- 
ding-Intervention orientierten, desto höher fielen die Lernzuwächse ihrer 
Schülerinnen und Schüler aus. Nunnery et al. (2006) erfassen Wiedergabetreue 
anhand mehrerer Komponenten wie z. B. Dosierung und Qualität. Im Gegen- 
satz zu den bereits genannten Studien berichten sie allerdings, dass die Wieder- 
gabetreue die Varianz zwischen den Leistungsunterschieden nur für Schülerin- 
nen und Schüler mit Behinderung, nicht aber für die Gesamtstichprobe erklä- 
ren kann. So ist der konkrete Zusammenhang zwischen der Wiedergabetreue 
und den Leistungen der Schülerinnen und Schüler noch unklar. Capin et al. 
(2018) stoßen in ihrem Review zur Wiedergabetreue in Leseinterventionen 
auch nur auf vier Studien, die überhaupt Zusammenhänge zwischen der Wie- 
dergabetreue und der Wirksamkeit der Intervention analysieren. Diese knap- 
pen Befunde weisen darauf hin, dass sich bisher nur eine geringe Anzahl von 
Studien diesem Thema explizit widmet und an dieser Stelle weiterer For- 
schungsbedarf besteht. 

Befunde aus Befragungen und Beobachtungen zum Einsatz der Kombina- 
tion aus Lernverlaufsdiagnostik und Lese-Sportler-Programm legen nahe, dass 
bei diesem umfassenden Ansatz die Variation zwischen Lehrkräften, die die 
Maßnahme wie geplant umsetzten und Lehrkräften, die größere Veränderun- 
gen vornahmen, hoch ausfiel (Hebbecker & Souvignier, 2018). So gaben einige 
Lehrkräfte an, durch Auslassen von Inhalten und Anpassungen der Methoden 
Änderungen bei der Durchführung vorgenommen zu haben. Vor dem Hinter- 
grund einer solchen Diskrepanz zwischen den Anforderungen des Konzepts 
und der tatsächlich gelebten Schulpraxis ist ein Rückschluss auf die Wirksam- 
keit der Methoden nicht sinnvoll. 

Um ein hohes Maß an Wiedergabetreue in der unterrichtlichen Praxis zu 
erzielen, empfehlen Hondrich et al. (2016) konkrete Materialien zu den Förder- 
konzepten zur Verfügung zu stellen. Dies entspricht dem von Lipowsky und 
Rzejak (2019) in ihrer Analyse wirksamer Fortbildungsmaßnahmen genannten 
Prinzip einer starken Orientierung an den Bedürfnissen der Zielpersonen im 
Implementationsprozess. Entsprechend werden beim Lese-Sportler-Programm 
zusätzlich zu den Aufgabenheften mittlerweile auch kindgerechte Ablaufpläne 
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der Methoden fiir den Aushang im Klassenzimmer sowie einseitige Kurzbe- 
schreibungen der Methoden fir die Lehrkrafte bereitgestellt. Zudem wurden 
Erklärvideos? für Lehrkräfte entwickelt, in denen neben theoretischen Grundla- 
gen auch unterrichtspraktische Fragen thematisiert werden. 

Zusammenfassend lassen sich für den Aspekt der Wiedergabetreue zwei 
Perspektiven ableiten: Zunächst erscheint es wichtig, dass die Wiedergabetreue 
in Evaluationsstudien standardmäßig - und unter Beachtung mehrerer Facet- 
ten des Konstrukts - erfasst wird, um Aussagen über die Wirksamkeit einer 
Intervention machen zu können (O’Donnell, 2008). Zweitens deutet sich an, 
dass Lehrkräfte gezielter Unterstützung bedürfen, um Maßnahmen zur Förde- 
rung der Leseflüssigkeit im Unterricht wiedergabetreu einsetzen zu können 
(Hebbecker & Souvignier, 2018). Hier empfiehlt es sich, bereits bei der Ent- 
wicklung der Intervention eine enge Orientierung an den Adressatinnen und 
Adressaten und den schulischen Rahmenbedingungen vorzunehmen und 
Lehrkräften praktikable Materialien und Informationsangebote zur Verfügung 
zu stellen (Lipowsky & Rzejak, 2019). 


4 Fazit 


Eine Vielzahl an wissenschaftlichen Studien zur Förderung der Leseflüssigkeit 
gibt Hinweise auf wirksame Förderansätze für den Leseunterricht. Insbeson- 
dere liefern (quasi-)experimentelle Studien hinreichend Evidenz dafür, dass 
Methoden wie das silbenbasierte Lesen und (wiederholtes) lautes Lesen sowie 
die Organisationsform des Partnerlesens mit unmittelbarem Feedback als zen- 
trale Wirkkomponenten gelten können (NICHD, 2000). Gleichzeitig weisen die 
Befunde von Studien in der unterrichtlichen Praxis inkonsistente Ergebnis- 
muster und mitunter auch geringe Effekte aus (Souvignier, 2020). Vor diesem 
Hintergrund stellt sich die Frage nach moderierenden Faktoren, beispielsweise 
mit Blick auf die Implementationsbedingungen, die die Wirksamkeit der Maß- 
nahmen beeinflussen können (Fuchs & Fuchs, 2019; Souvignier, 2020). 

Mit der Passung, der Dosierung und der Wiedergabetreue sind wir auf drei 
dieser potenziell moderierenden Faktoren eingegangen. Auf den ersten Blick 
mag die Auseinandersetzung mit diesen Aspekten überraschen. Denn es er- 
scheint unmittelbar plausibel, dass auf die individuellen Bedürfnisse zuge- 
schnittene Maßnahmen besonders wirksam sind, dass es grundsätzlich förder- 
lich ist, eine möglichst große Zahl an Übungsmöglichkeiten anzubieten und 
dass Maßnahmen umso wirksamer sind, je enger man sich an Empfehlungen zu 
deren Durchführung hält. Trotz dieser theoretischen Nachvollziehbarkeit feh- 


2 Unser YouTube-Kanal: https://www.wwu.de/PsyIPBE.Download/YT. 
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len empirische Studien zum Einfluss moderierender Faktoren. Diese erscheinen 
insbesondere vor dem Hintergrund erforderlich, dass Untersuchungen zur 
Bestandsaufnahme schulischer Praxis zeigen, dass differenzierte Forderung und 
die Nutzung evidenzbasierter Methoden eher selten sind (Philipp, 2014). 

Ziel bei der Entwicklung des Lese-Sportler-Programms war daher zunächst, 
drei evidenzbasierte Methoden fur eine differenzierte Leseforderung so aufzu- 
bereiten, dass sie sich leicht im unterrichtlichen Alltag umsetzen lassen. Damit 
eine optimale Passung zwischen dem individuellen Lernstand und der angebo- 
tenen Fördermethode erreicht wird, wurde das Material mit der Lernverlaufs- 
diagnostik quop verknüpft, anhand derer über das Schuljahr hinweg fortlau- 
fend geprüft wird, welche Fördermethode passend für ein Kind ist (Souvignier 
et al., 2021). Das Lese-Sportler-Programm wurde frei verfügbar über unsere 
Website zugänglich gemacht, sodass Lehrkräfte unmittelbar auf die jeweiligen 
Materialien zugreifen können. Frei editierbare Vorlagen ermöglichen es Lehr- 
kräften, eigene Texte einzubinden. Informationsmaterialien wie ein Handbuch 
für Lehrkräfte vermitteln Anwendungswissen zur Nutzung des Forderkonzepts. 
Schließlich wurden Erklärvideos erstellt, anhand derer Informationen zu theo- 
retischen Hintergründen und zur praktischen Anwendung gegeben werden. Ein 
solches rahmendes Konzept aus Diagnostik, Material und Information soll dazu 
beitragen, die Implementation des Lese-Sportler-Programms - nicht zuletzt im 
Hinblick auf Passung, Dosierung und Wiedergabetreue - in die schulische 
Praxis zu unterstützen. 
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Ein Lesestrategietraining 
im Distanzunterricht? 


Wie sich das veranderte Lernumfeld wahrend 
der Corona-Pandemie auf die Entwicklung des 
Leseverstehens von Schulerinnen und Schulern 
auswirkt 


Johannes Wild, Elisabeth Kraus, Maria Steinert, Sven Hilbert 
& Anita Schilcher 


Zusammenfassung: Lesestrategietrainings gelten als effektives Mittel, um das Lese- 
verstehen von Schülerinnen und Schülern zu fördern. Während zur Implementation in 
klassischen Unterrichtssettings inzwischen zahlreiche Studien vorliegen, sind nur 
wenige belastbare Forschungsergebnisse zu digitalen Trainingsumgebungen vorhan- 
den. Zur Durchführung eines klassischen Lesetrainings in der Form von Distanzunter- 
richt liegen bislang keine Ergebnisse im deutschsprachigen Raum vor. Die vorliegende 
Studie untersucht an einer Stichprobe von 1.531 Grundschulkindern, wie sich die mit 
dem Distanzunterricht während der Corona-Pandemie einhergehenden veränderten 
Durchführungsbedingungen des FiLBY-Lesetrainings auf den Lernfortschritt der 
Schülerinnen und Schüler auswirken. Es wird deutlich, dass die Vermittlung der 
Lesestrategien durch die Lehrkraft selbst ein wichtiges Element für erfolgreichen Dis- 
tanzleseunterricht ist. Erklärvideos und Erklärtexte können die Strategiemodellierung 
durch die Unterrichtenden nicht vollständig ersetzen. 


Schlüsselwörter: Lesestrategien, Modellieren, Grundschule, Längsschnitt, Distanz- 
unterricht 


Abstract: Reading strategy trainings are considered an effective approach to promote 
reading comprehension. While there are now numerous studies on the implementation 
of reading strategies in classical classroom settings, there are only a few reliable 
research results on digital trainings. So far, there are no results on the implementation 
of classical reading strategy programs in the form of distance learning in German- 
speaking countries. The present study investigates a sample of 1.531 students and 
examines how the changed conditions of the implementation of the FiLBY (Fach- 
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integrierte Leseförderung Bayern) reading training that have accompanied distance 
learning affect the learning progress of the students during the Corona pandemic. It is 
evident that modeling the reading strategies by the teacher is an important element for 
successful distance reading instruction. It cannot be substituted by explanatory videos 
or texts. 


Keywords: reading strategies, modeling, elementary school, longitudinal, distance 
learning 


1 Einleitung 


Bereits in den 1970er Jahren zeigte die wegweisende Studie von Durkin (1978), 
dass die systematische Förderung des Leseverstehens in amerikanischen 
Grundschulklassen bis dahin praktisch keine Rolle gespielt hatte. Statt die 
Schülerinnen und Schüler etwa durch die Vermittlung von Lesestrategien ef- 
fektiv zu unterstützen, überprüften die Lehrkräfte in den von Durkin unter- 
suchten Unterrichtsstunden lediglich das Leseverstehen oder gaben allgemeine 
Hinweise zur Aufgabenanforderung. In Folge der Studie erlebte die unter- 
richtsbezogene Leseforschung international einen regelrechten Aufschwung, 
sodass heute zahlreiche Befunde sowohl im Bereich der Grundlagen- wie auch 
der Interventionsforschung vorliegen (Pearson & Cervetti, 2017; Okkinga, van 
Steensel, van Gelderen, van Schooten, Sleegers & Arends, 2019). In Deutschland 
rückten vor allem die schlechten Ergebnisse der deutschen Schülerinnen und 
Schüler in der ersten PISA-Studie die Förderung des Leseverstehens durch 
Lesestrategien in das Bewusstsein der Forschung (exemplarisch z. B. Willen- 
berg, 2004). 

Obgleich die Forschungsbefunde inzwischen auch in der Schulpraxis 
Früchte tragen - international verfügen die deutschen Schülerinnen und Schü- 
ler beispielsweise in der Sekundarstufe über das höchste Lesestrategiewissen 
(Diedrich, Schiepe-Tiska, Ziernwald, Tupac-Yupanqui, Weis, McElvany & 
Reiss, 2019) -, ist der Anteil schwach Lesender sowohl in der Primar- als auch 
in der Sekundarstufe noch immer hoch (Bremerich-Vos, Wendt & Bos, 2017; 
McElvany, Kessels, Schwabe & Kasper, 2017; Weis, Doroganova, Hahnel, Be- 
cker-Mrotzek, Lindauer, Artelt & Reiss, 2019). Diese Befunde deuten darauf 
hin, dass ein Transfer der gelernten Strategien in das prozedurale Wissen nicht 
ausreichend gelingt, sodass die Strategien im Alltag nicht gewinnbringend ein- 
gesetzt werden können. Die langfristige Integration von Lesestrategien in den 
Schulalltag anstelle lediglich kurzfristiger und isolierter Maßnahmen wird von 
Pearson und Cervetti (2017) deshalb zurecht als Achillesferse von Lesestrategie- 
programmen bezeichnet. Das hier vorgestellte Leseförderprogramm FiLBY 
(Fachintegrierte Leseförderung Bayern) will Lesestrategien langfristig in das 
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Repertoire von Grundschülerinnen und Grundschülern integrieren. Es wurde 
in Kooperation mit dem Bayerischen Staatsministerium fiir Unterricht und 
Kultus als langfristiges Training über mehrere Schuljahre hinweg angelegt und 
ist mit einer intensiven Schulung und Begleitung der beteiligten Lehrkräfte 
verbunden. In der dritten Jahrgangsstufe liegt der Fokus auf der Vermittlung 
von Lesestrategien. Da die reguläre Durchführung des FiLBY-Trainings in 
dieser Jahrgangsstufe aufgrund der Corona-Pandemie nur eingeschränkt 
möglich war, nahm ein Teil der Lehrkräfte Anpassungen vor (etwa Einsatz von 
Erklärvideos oder Erklärtexten zur Strategievermittlung, Ersatz des Strategie- 
trainings durch ein Lautleseverfahren), um unter den veränderten Unterrichts- 
bedingungen dennoch mit FiLBY weiterarbeiten zu können. Im Folgenden 
werden zunächst theoretische Grundlagen des Trainings beschrieben, bevor 
Anforderungen an einen erfolgreichen Distanz-Leseunterrichts abgeleitet wer- 
den. Methodik und Ergebnisse der Untersuchung des FiLBY-Trainings im Dis- 
tanzunterricht werden im Anschluss präsentiert. 


2 _ Leseverstehen durch Lesestrategien fördern 


Neuere Definitionsversuche von Lesestrategien, etwa von Anmarkrud und 
Bräten (2012) oder Okkinga et al. (2019), betonen deren instrumentellen Cha- 
rakter für das Leseverstehen. Im Gegensatz zu den automatisierten Lesefertig- 
keiten, die durch die Optimierung des Dekodierens zwar ebenfalls zum Lese- 
verstehen beitragen, in der Regel aber ohne eine bewusste Kontrolle ablaufen, 
werden Strategien planvoll, d. h. bewusst und zielgerichtet, eingesetzt und kon- 
trolliert (Afflerbach, Pearson & Paris, 2008; Philipp, 2010; Almasi & Hart, 2019; 
Lenhard, 2019; Rosebrock & Nix, 2020). Sie können „darauf abzielen, dass man 
seine Motivation beeinflusst oder aber gezielt neues Wissen auswählt, sich an- 
eignet, es organisiert oder in sein eigenes Wissen integriert“ (Philipp, 2017, 
S. 117). 

Dabei kann eine Strategie sowohl einzelne Handlungen umfassen als auch 
komplexere Handlungssequenzen (Duffy, 1993; Philipp, 2017). Lesestrategien 
können nach unterschiedlichen Gesichtspunkten klassifiziert werden. Gängige 
Kategorien orientieren sich etwa an dem Zeitpunkt ihres Einsatzes (vor, wäh- 
rend, nach dem Lesen), dem Bezugspunkt der Aktivität (kognitiv, metakognitiv, 
ressourcenbezogen), der zugeordneten Funktion (z.B. ordnend, wiederholend, 
elaborierend), der Verarbeitungstiefe (Oberflächen-, Tiefenstrategien) oder an 
der Spezifität (allgemein, domänenspezifisch, aufgabenspezifisch). Hinzu kom- 
men spezielle Anforderungen unterschiedlicher Textarten, etwa diskontinuier- 
licher und kontinuierlicher Texte oder von Hypertexten (Philipp, 2017). Lese- 
rinnen und Leser müssen deshalb nicht nur in der Lage sein, erworbene Strate- 
gien situationsspezifisch auszuwählen, sondern diese auch an die jeweiligen 
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Anforderungen anzupassen (Duffy, 1993; Artelt & Dörfler, 2011; Wild & 
Schilcher, 2019). 

Die im Folgenden zitierten Metaanalysen unterstreichen die generelle Wirk- 
samkeit von Lesestrategietrainings für das Leseverstehen, zeigen aber auch 
deren Sensitivität für die Art und Weise der Durchführung und Evaluation. 
Hinsichtlich der Durchführung erweist es sich als sinnvoll, über einen längeren 
Förderzeitraum mindestens zwei Strategien in einer Kombination aus direkter 
Instruktion sowie reziproken Lehren und Lernen einzuführen und systematisch 
zu üben. Als besonders gewinnbringend erweisen sich dabei Fragestrategien, 
das Zusammenfassen und das Überwachen des eigenen Leseprozesses (Sou- 
vignier & Antoniou, 2007; Edmonds, Vaughn, Wexler, Reutebuch, Cable, 
Klingler Tackett & Wick Schnakenberg, 2009; Slavin, Lake, Chambers, Cheung 
& Davis, 2009; Mayer & Marks, 2019). Duffy (1993) weist jedoch darauf hin, 
dass es weniger darauf ankomme, welche konkreten Strategien Schülerinnen 
und Schüler lernen, sondern dass es das strategische Denken an sich ist, das sie 
lernen müssten: „what is basic in strategy instruction, particulary for low achie- 
vers, is not whether teachers are teaching the right strategies but, rather, 
whether students are developing an integrated concept of what it means to be 
strategic“ (Duffy, 1993, S. 231). Dazu reicht es nicht, wenn die unterrichtenden 
Lehrkräfte die Schülerinnen und Schüler von der Notwendigkeit von Lesestra- 
tegien überzeugen, es kommt vielmehr darauf an, ihnen die einzelnen Strate- 
gien sowie die Bedingungen und Ziele ihres Einsatzes umfassend zu erklären 
(Wild & Schilcher, 2019). 

Im angloamerikanischen Raum hat sich hinsichtlich der Strategievermitt- 
lung das sechsstufige Vorgehen des Self-Regulated Strategy Developments 
(SRSD) etabliert, bei dem das Modellieren der Strategien durch die Lehrkraft 
im lauten Denken ein zentrales Element ist und die Verantwortung für die 
Strategie Schritt für Schritt in die Hand der Schülerinnen und Schüler übergeht 
(Lienemann & Ried, 2006; vgl. Pissarek, 2018). Am Modell der Lehrkraft erhal- 
ten die Lernenden zunächst Einsichten in die Denkvorgänge eines Experten 
und vollziehen die Strategieanwendung sowie deren Begründungskontexte 
gedanklich nach, um sie später selbstständig und flexibel einsetzen zu können 
(vgl. auch Bandura, 1979). Sie erwerben außerdem Hintergrundwissen zu den 
Lesestrategien. Nach einer Memorierphase, die dem Verankern der Strategie im 
deklarativen Wissen dient, üben die Kinder unter Anleitung der Lehrperson, 
die Strategien auf neue Texte zu übertragen. Um einer ineffizienten Nutzung 
und motivationalen Defiziten vorzubeugen, strukturiert diese dabei das Lern- 
setting stark vor, korrigiert oder lobt und gibt Tipps für die Weiterarbeit (vgl. 
Hasselhorn & Gold, 2013; Philipp, 2015). Je besser die Kinder die Strategie- 
arbeit beherrschen, desto stärker nimmt sich die Lehrkraft zurück. Deshalb 
erweist sich in Übungsphasen das Arbeiten in Kleingruppen, in denen sich die 
Schülerinnen und Schüler gegenseitig unterstützen und beraten können, als 
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sehr günstig (Brown & Palinscar, 1989; Mayer & Marks, 2019; zum computer- 
basierten kooperativen Lernen vgl. Chen, Wang, Kirschner & Tsai, 2018). 
Dennoch sind die Kinder auch hier auf die Unterstiitzung der Lehrperson an- 
gewiesen, da die Mitschülerinnen und Mitschüler oft vor vergleichbaren Pro- 
blemen stehen und deshalb die Probleme ihrer Mitschülerinnen und Mitschüler 
nicht lösen können. 

Der Lehrkraft kommt also bei der Strategievermittlung eine zentrale Rolle 
zu, sowohl bei der Einführung als auch beim Üben. Qualitative Studien zeigen 
jedoch, dass Lehrerinnen und Lehrer die größten Probleme bei der Umsetzung 
von Interventionen haben, die die Prinzipien der Strategieinstruktion, des 
Modellierens und der Gruppenarbeit nutzen (Okkinga et al., 2019). Nicht zu- 
letzt deshalb betonen Souvignier, Förster und Kawohl (2016), dass Lehrkräfte 
mit Hilfe gut strukturierter Materialien bei der Umsetzung komplexer Trai- 
ningsprogramme unterstützt werden müssten. 


3 Das Lesetraining FiLBY (Fachintegrierte Leseförderung Bayern) 


In FiLBY werden den Lehrkraften daher nicht nur flachendeckend umfangrei- 
che Trainingsmaterialien kostenfrei zur Verfügung gestellt, die Implementation 
wird darüber hinaus durch ein wissenschaftliches Team der Universität Re- 
gensburg betreut sowie durch eine interaktive Fortbildungsplattform unter- 
stützt. Das FiLBY-Training erstreckt sich über insgesamt drei Schuljahre, in 
denen jeweils sowohl mit narrativen Texten (Klassenlektüre, erstes Schulhalb- 
jahr) als auch mit eigens verfassten, altersangemessenen Sachtexten (zweite 
Schuljahreshälfte) trainiert wird. 

Während in der zweiten Jahrgangsstufe (FiLBY-2; Schilcher, Wild & Stei- 
nert, 2019) die Leseflüssigkeit als Basis des Leseverstehens fokussiert wird, steht 
in der dritten Jahrgangsstufe (FiLBY-3; Wild, Schilcher & Steinert, 2020) die 
Vermittlung effektiver kognitiver Lesestrategien für literarische Texte (Vorwis- 
sen aktivieren, Figur, Ereignis und Situation untersuchen) und Sachtexte (Vor- 
wissen aktivieren, Überfliegen, Visualisieren) im Vordergrund. Es handelt sich 
dabei um kognitive (ordnende, elaborierende und wiederholende) Strategien, 
die durch Modellieren der Lehrkraft im lauten Denken für unterschiedliche 
Phasen des Leseprozesses eingeführt und anschließend über mindestens vier 
Wochen hinweg täglich geübt werden. Im Sinne eines Scaffoldings wird der 
Strategieeinsatz zunächst von der Lehrkraft gezeigt und mit ihr gemeinsam 
geübt, wobei auch kooperative Lernphasen eingeplant sind. Im ersten Schul- 
halbjahr werden also literarische Strategien an einer Ganzschrift trainiert, im 
zweiten Schulhalbjahr Strategien für Sachtexte (zum Material vgl. https://www. 
lesen.bayern.de/filby3). Eine Besonderheit der 60 zur Verfügung gestellten 
Sachtexte ist, dass sie alle gleich lang und gleich schwer sind. In der vierten 
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Jahrgangsstufe (FiLBY-4; Steinert, Schilcher & Wild, 2021) kommen zusätzlich 
metakognitive Strategien hinzu. Die Lehrkräfte nehmen jeweils am Anfang 
eines Schuljahres an einer zweitägigen Fortbildung teil und erhalten eine Ein- 
führung in das Training, unterstützt durch eine Online-Fortbildungsplattform. 
Darüber hinaus bekommen sie Lehrerhandreichungen, die die didaktischen 
Grundlagen des Trainings nochmals zusammenfassen sowie Stundenverläufe 
und weiteres Unterrichtsmaterial enthalten (z.B. Moderationskarten zum 
Modellieren der Strategien). Die Begleitevaluation begann im Schuljahr 2018/19 
in der zweiten Jahrgangsstufe (Messzeitpunkte 1-3) und wird im Schuljahr 
2020/21 abgeschlossen sein. 

Erste Analysen zeigen, dass das FiLBY-Training von der zweiten Klasse an 
positive Effekte für das Leseverstehen hatte, sodass die anfänglich schwächere 
Experimentalgruppe (EG) im Vergleich zur Kontrollgruppe (KG) signifikant 
größere Fortschritte machte und bis zum Ende der dritten Jahrgangsstufe ihren 
Rückstand bereits aufgeholt hatte (Messzeitpunkt 5). Ähnliche Ergebnisse zei- 
gen sich hinsichtlich der Leseflüssigkeit (Schilcher, Wild, Kraus & Hilbert, in 
Druck; zum Leseverstehen vgl. Abb. 1). 


Abbildung 1: Entwicklung des Leseverstehens der FiLBY-Experimentalgruppe (EG) im 
Vergleich zur Kontrollgruppe (KG) mit regulärem Leseunterricht (Messzeitpunkte 2/3: 
Mitte bzw. Ende der zweiten Jahrgangsstufe, Messzeitpunkte 4/5: Mitte bzw. Ende der 
dritten Jahrgangsstufe). Zu Messzeitpunkt 4 lagen keine Daten der KG vor. Das Lese- 
verstehen wurde mittels des Bayerisches Lesetest BYLET erfasst (vgl. Teilkap. 6.2) 


= 20) 


Summenwert Leseverstehen (Maximum 


i 2 3 H 5 
Messzeitpunkt 


M = Mittelwert, SD = Standardabweichung. Darstellung in Rohpunkten, da die Normierung pro Messzeit- 
punkt erfolgte. Die Balken zeigen die Standardfehler der Gruppenmittelwerte an. 
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Im Februar 2020 wurde das Training der dritten Klassen jedoch durch die 
weltweite Corona-Pandemie unterbrochen. Die Einschränkung des regulären 
Unterrichtsbetriebs durch das Pandemiegeschehen wirkte sich auch auf die 
Entwicklung der Lesekompetenz der an FiLBY teilnehmenden Schülerinnen 
und Schüler aus (vgl. Abb. 1: Messzeitpunkt 4 und 5): Die Kinder der Experi- 
mentalgruppe entwickelten sich analog zur Kontrollgruppe. Viele Lehrkräfte 
unterbrachen aufgrund der Pandemie das FiLBY-Training, ein Teil führte die- 
ses jedoch als Bestandteil ihres Distanzunterrichts weiter und nahm Anpassun- 
gen vor, um der veränderten Lehrsituation gerecht zu werden. 


4 Lehren und Lernen in Distanz 


Der Distanzunterricht kann als eine Form der Fernlehre bzw. ‚distance educa- 
tion‘ verstanden werden. Diese „umfasst alle Formen des Lehrens und Lernens, 
bei denen eine Betreuung durch Lehrende regelmäßig über Distanzen erfolgt“ 
(Kerres, 2018, S. 520). Im Unterschied zum vorliegenden Training handelt es 
sich dabei aber häufig um kommerzielle Angebote, in denen Lerninhalte aufbe- 
reitet werden (Fickermann & Edelstein, 2020). Die Lernumgebung zeichnet sich 
vor allem durch eine zerdehnte Kommunikationssituation aus, das heißt zeitli- 
che, räumliche und/oder emotionale Trennung der Beteiligten (Ehlich, 1984), 
wenngleich diese zum Teil mit Hilfe analoger (z. B. Wochenplan) oder digitaler 
Hilfsmittel (z.B. Videokonferenz) überbrückt werden kann. Eine Untersu- 
chung von Wacker, Unger und Rey (2020) während der ersten Schulschließun- 
gen zeigt, dass die Vermittlung von Lerninhalten, Arbeitsaufträgen und Feed- 
back in den meisten Fällen per E-Mail geschah, gefolgt von Lernplattformen, 
Cloudspeicher oder über Homepages. Der Distanzunterricht während der 
Schulschließungen kann also überwiegend als ein wenig betreutes Lernsetting 
charakterisiert werden. Dies ist deshalb problematisch, da es vielen Schülerin- 
nen und Schülern nicht gelingt, sich ohne Unterstützung der Lehrkraft selbst zu 
organisieren und zu lernen (Porsch & Porsch, 2020). 

Für das erfolgreiche Lernen zuhause benötigen die Schülerinnen und Schü- 
ler eine gut strukturierte Lernumgebung, ansprechbare Hilfspersonen, die bei- 
spielsweise bei Problemen weiterhelfen können, sowie konstruktives Feedback 
auf ihre Arbeit (Stahns, Rieser & Lankes, 2017; Dumont, 2019; Köller, Flecken- 
stein, Guill & Meyer, 2020; Huber & Helm, 2020). Das setzt konkrete, erreich- 
bare Ziele, beispielsweise über Tages- oder Wochenpläne, voraus (Klieme, 
2020). Lehrerinnen und Lehrer müssen also wie im Präsenzunterricht die 
„Vorbereitung, Begleitung und Nachbearbeitung der häuslichen Arbeiten“ 
(Koller et al., 2020, S. 164) gewährleisten. Gerade in komplexen (digitalen) 
Lernumgebungen, wie sie beim Distanzlernen häufig auftreten, benötigen die 
Kinder demnach Kontaktmöglichkeiten (z.B. Videotreffen, Chat, Telefon- 
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sprechstunde) sowie eine ausreichende Unterstiitzung beim Lernen (z. B. vor- 
strukturiertes Webquest), um motiviert, konzentriert und zielgerichtet zu ar- 
beiten (Segers & Verhoeven, 2009; Kunter & Ewald, 2016; Klieme, 2020; Köller 
et al., 2020). Uberlassen Lehrpersonen dies den Erziehungsberechtigten, kön- 
nen sozioökonomisch bedingte Leistungsdisparitäten verschärft werden 
(McElvany, Becker & Lüdtke, 2009; Niederbacher & Neuenschwander, 2020; 
Holzberger, Reinhold, Lüdtke & Seidel, 2020). Weder sind die Eltern darauf 
vorbereitet, die Rolle der Lehrkraft zu übernehmen, noch fühlen sie sich dazu in 
der Lage (Besa, Gensler, Gesang & Röhrig, 2020). 

Soll ein Lesetraining wie FiLBY-3 unter den Bedingungen des Distanzler- 
nens gelingen und ein negativer Effekt auf das Leseverstehen, wie er etwa häufig 
in unterrichtsfreien Zeiten bei Kindern aus bildungsfernen Familien auftritt 
(Stanovich, 2000), und die Lesemotivation vermieden werden, reicht es nicht 
aus, die Kinder lediglich zum Lesen aufzufordern bzw. ihnen im Rahmen von 
Wochenplänen etc. „Lesezeit“ abzuverlangen oder das Lesen von Texten als 
Aufgabe zu geben, da gerade schwach Lesende Leseaufgaben zu vermeiden 
suchen (Stalder, 2013; Nonte, Hartwich & Willems, 2018). Lehrerinnen und 
Lehrer sollten systematisch und strukturiert mit dem vorliegenden Trainings- 
material arbeiten. 

Das Modellieren der Strategien im lauten Denken sollte durch die Lehrkraft 
selbst erfolgen, da die emotionale Beziehung zur Lehrkraft für das Lernen eine 
wichtige Rolle spielt (Casale, Börnert-Ringleb & Hillenbrand, 2020; Rubach & 
Lazarides, 2021). Die Bedingungen ihrer Anwendung sollten dabei ebenfalls 
geklärt werden. Zwar können unterstützend entsprechende Erklärvideos o. A. 
eingesetzt werden, etwa zur Wiederholung, jedoch ist davon auszugehen, dass 
Kinder dieses Alters sich komplexe Lesestrategien wie die vorliegenden nicht 
selbstständig aneignen können. Auch die inhaltliche Kohärenz zwischen ein- 
zelnen Trainingseinheiten geht ohne Unterstützung der Lehrperson verloren, 
da für den Erfolg zentrale Aspekte fehlen. Auch im Distanzunterricht sollten 
sich nach der Einführung von Strategien gemeinsame Übungsphasen mit der 
Lehrkraft anschließen, bei denen die Ziele des Trainings nochmals betont, 
Probleme der Kinder geklärt oder Strategien wiederholt bzw. angepasst werden 
können (Okkinga et al., 2019). Dies unterstützt die Schülerinnen und Schüler 
einerseits dabei, das Lernen zu organisieren, zum anderen können Strategie- 
nutzungsdefizite erkannt und vermieden werden. Deshalb ist es vor allem am 
Anfang des Trainings wichtig, dass die Lernenden durch die Lehrkraft selbst 
zeitnah und unmittelbar Feedback erhalten (Dumont, 2019; Köller et al., 2020) 
und die Beziehung aufrecht erhalten wird, indem sie als Ansprechpartner zur 
Verfügung steht, lobt oder korrigiert (Casale et al., 2020). 

Es bietet sich im Rahmen des Distanzunterrichts an, mit den einzelnen Kin- 
dern Kontakt zu halten und auch auf kooperative Lernformen in Kleingruppen 
(z.B. in Break-out-Rooms) zu setzen, damit die Kinder nach und nach selbst 
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Aufgaben wie das Feedback oder die nochmalige Erklärung übernehmen. Ein 
solides Wissen über den Einsatz von digitalen Medien im Unterricht ist also 
eine Voraussetzung, um die zuvor dargestellten Ansprüche zu realisieren 
(Reiss, 2020). Welche Anpassungen die Lehrkräfte in Hinblick auf die Durch- 
führung von FiLBY im Distanzunterricht konkret vornahmen und wie erfolg- 
reich diese waren, wird im Ergebnisteil berichtet. 


5 Zusammenfassung und Forschungsfragen 


Als zentrale Gelingensfaktoren für den Unterricht zuhause lassen sich aufgrund 
der zuvor dargestellten Ergebnisse zusammenfassend drei Aspekte identifizie- 
ren: eine strukturierte Lernumgebung, die Verfügbarkeit von Hilfspersonen 
sowie konstruktives Feedback. Die Lehrkräfte sollten Lesestrategien deshalb 
nach Möglichkeit persönlich einführen und die Kinder während der anschlie- 
ßenden Übungsphasen konstruktiv begleiten, auch während kooperativer Ar- 
beitsphasen. Die folgende Untersuchung beschäftigt sich daher damit, welche 
Anpassungen die an FiLBY beteiligten Lehrkräfte (1) generell und (2) in Bezug 
auf das Training vorgenommen haben: 

Um alle weiteren Analysen in den chronologischen Verlauf einzubetten, 
wird zunächst auf Basis von Fragebogendaten dargestellt, welche Unterrichts- 
elemente die Lehrpersonen in ihrem Distanzunterricht integrierten, wie den 
Schülerinnen und Schülern das benötigte Arbeitsmaterial zur Verfügung ge- 
stellt wurde, wie der Unterricht an sich organisiert wurde und wie die Kinder 
beim Lernen unterstützt wurden (etwa Kontrolle von Lernergebnissen, Feed- 
back). Daneben wird ausgewertet, welches inhaltliche bzw. organisatorische 
Unterstützungspotenzial die Lehrpersonen den Erziehungsberechtigten zuma- 
ßen und ob diese Anpassungen bzw. Einschätzungen der Lehrkräfte in Zusam- 
menhang mit einer Fortführung des FiLBY-Trainings in der Pandemiesituation 
standen. 

Anschließend wird untersucht, welche Anpassungen in Hinblick auf das 
FiLBY-3-Training im Distanzunterricht vorgenommen wurden und wie för- 
derlich diese hinsichtlich des Leseverstehens waren. Damit ergeben sich zwei 
maßgebliche Forschungsfragen: 


1. Wie gestalteten Grundschullehrkräfte ihren Leseunterricht (un)abhängig 
von FiLBY-3 während der pandemiebedingten Schulschließungen im Früh- 
jahr 2020? 

2. Wie hängen die von den Lehrkräften im Rahmen der Durchführung von 
FiLBY-3 ergriffenen Anpassungen während des Distanzunterrichts mit der 
Entwicklung des Leseverstehens ihrer Schülerinnen und Schüler zusam- 
men? 
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6 Methode 


6.1 Stichprobe und Beschreibung des Studienablaufs 


An der longitudinalen Evaluation der FiLBY-Studie nehmen insgesamt ca. 
8.500 bayerische Schülerinnen und Schüler teil. Davon entfallen etwa 7.000 
Kinder auf die Experimentalgruppe und 1.500 Kinder auf die Kontrollgruppe 
(KG), die kein systematisches Lesetraining erhält, sondern im Rahmen des 
regulären Unterrichts Lesen trainiert. Aufgrund der unvermittelten Schul- 
schließungen war es vielen Lehrkräften nicht mehr möglich, die Testungen 
durchzuführen, weshalb nur von einem Teil der Stichprobe Daten vorliegen. 
Ein großer Teil der Lehrkräfte der Experimentalgruppe konnte während der 
Schulschließungen die FiLBY-3-Materialien nicht wie geplant für das Lesetrai- 
ning einsetzen, führte die Testungen aber dennoch durch. Die Experimental- 
gruppe wurde daher für die folgenden Analysen geteilt: Die Schülerinnen und 
Schüler, die auch im Distanzunterricht weiterhin mit FiLBY arbeiteten, werden 
als Trainingsgruppe (TG) bezeichnet. Diejenigen Klassen, die seit Beginn der 
Schulschließungen nicht mehr mit den FiLBY-Materialien arbeiteten, wurden 
zu einer Pseudokontrollgruppe (PG) zusammengefasst (vgl. Abb. 2). 


Abbildung 2: Stichprobenaufteilung unter den veränderten Durchführungsbedingungen 
der Corona-Pandemie 
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Die Analysen umfassen die beiden Messzeitpunkte der dritten Jahrgangsstufe 
(Messzeitpunkte 4 bzw. 5: Marz bzw. Juni/Juli 2020). Fir diesen Zeitraum lie- 
gen von einer Teilstichprobe von 85 Lehrkraften der TG/PG und ihren dritten 
Klassen Informationen zur Leseleistung der Schiilerinnen und Schiiler (N = 
1.531) sowie zur Fortführung des FiLBY-Trainings während der Schulschlie- 
ßungen vor. Das Leseverstehen wurde zu beiden Messzeitpunkt erfasst, also vor 
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bzw. nach den Schulschließungen, die Fortführung des FiLBY-Trainings ein- 
malig durch Befragung der Lehrkräfte. Tabelle 1 gibt eine Übersicht über die 
Zusammensetzung der Stichprobe zu den beiden Messzeitpunkten. 


Tabelle 1: Übersicht der Klassen und Schülerzahlen zu den Messzeitpunkten 4 und 5. 
Schülerinnen und Schüler mit fehlenden Werten zu einem der beiden Messzeitpunkte 
(MZP) wurden nicht ausgeschlossen 


Pseudokontroll- Trainingsgruppe (TG) Gesamt 
gruppe (PG) 
Klassen | Schüler/ Klassen Schüler/ Klassen Schüler/ 
-innen -innen -innen 
MZP 4 22 371 27 433 49 804 
MZP 5 33 578 41 697 74 1.275 
Gesamt 38 695 47 836 85 1.531 


Die demografischen Daten liegen von 1.227 Schiilerinnen und Schiilern der 
Stichprobe vor. Die Mehrheit der Kinder (84.4%) gab an, in Deutschland gebo- 
ren zu sein. Lediglich 12.7% waren nicht in Deutschland geboren, rund 3.0% 
machten keine Angabe oder wussten es nicht. Das Geschlechterverhältnis ist 
ausgewogen (weiblich = 49.9%). Es handelt sich bei den beteiligten Lehrkräften 
überwiegend um erfahrene Lehrpersonen, die im Median 11-15 Jahre in ihrem 
Beruf tätig waren. 


6.2 Messinstrumente 


Das Leseverstehen wurde mit dem Bayerischen Lesetest (BYLET) erfasst. Es 
handelt sich dabei um einen neu entwickelten Leseverstehentest mit drei Paral- 
lelversionen, bei dem die Schülerinnen und Schüler 20 Multiple-Choice-Fragen 
zu vier in ihrer Komplexität ansteigenden Textabschnitten beantworten. Ge- 
genstand des Texts ist eine trainingsferne Science-Fiction-Geschichte: Eine 
Weltraumcrew erkundet einen neuen Planeten und erlebt ein Abenteuer. Da 
der Test zusätzlich eine steigende Aufgabenschwierigkeit innerhalb der Textab- 
schnitte aufweist, kann er das Leseverstehen innerhalb eines breiten Leistungs- 
spektrums erfassen. Ein Beispielitem kann unter https://is.gd/bylet_sample 
(Username: filby, Password: lesetraining) eingesehen werden. 

Eine Pilotstudie (Kraus, Wild, Schilcher & Hilbert, 2021) zeigt, dass die Art 
der Konzeption vorwissensbedingte und geschlechtsspezifische Verzerrungen 
vermeidet und deshalb eine gute Voraussetzung für eine faire Messung des Le- 
severstehens bietet. Zur Auswertung wurden die 20 Multiple-Choice-Fragen als 
richtig oder falsch kodiert und mittels Raschmodell psychometrisch modelliert 
(Rasch, 1960; Andersen, 1973). Zur externen Validierung wurde die Korrelation 
mit der Leseflüssigkeit geprüft, erfasst durch das Salzburger Lesescreening 2-9 
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(SLS 2-9; Wimmer & Mayringer, 2016). Der Zusammenhang von BYLET und 
SLS betrug r = .43, sodass von einer validen Messung der Lesekompetenz aus- 
gegangen werden kann. Zur besseren Interpretierbarkeit wurden die Testwerte 
im Folgenden auf die IQ-Skala (M = 100, SD = 15) normiert. Die Ergebnisse der 
psychometrischen Analysen können im OSF-Repositorium (https://osf.io/ 
9cspz/) eingesehen werden. 

Die unterrichtenden Lehrkrafte wurden im Juli 2020 mittels Online-Frage- 
bogen befragt. Dieser erfasst neben allgemeineren Fragen zur Gestaltung und 
Bewertung des Distanzunterrichts auch Aspekte der Umsetzung des Lesestrate- 
gietrainings FiLBY sowie Fragen zur Ausstattung und Erfahrung der Lehrkraft 
mit digitalen Geräten und Medien. 


6.3 Statistische Analysen 


Alle statistischen Analysen wurden mit der Statistiksoftware R (R Core Team, 
2020) durchgeführt. Zur Beantwortung der ersten Forschungsfrage werden 
deskriptive Statistiken erstellt. Konkret werden die Häufigkeiten der Variablen 
zur Strukturiertheit des Unterrichts, zur Unterstützung sowie zum Stellenwert 
des Lesens bei den Lehrpersonen berechnet und mit den Schülerleistungen in 
Beziehung gesetzt. 

Zur Untersuchung der zweiten Forschungsfrage werden zwei hierarchisch 
lineare Regressionsmodelle geschätzt. Die Datenstruktur ist in zweifachem 
Sinne hierarchisch, also geschachtelt. Zum einen wurden dieselben Kinder 
zweimal getestet, sodass von jedem Kind jeweils zwei Lesetestergebnisse vorla- 
gen (Messungen geschachtelt in Kindern). Gleichzeitig ist anzunehmen, dass 
Kinder, die dieselbe Klasse besuchten, sich in ihren Entwicklungen gleichen, so- 
dass auch die Schachtelung von Kindern in Schulklassen berücksichtigt werden 
muss. Durch die Schachtelung entstehen Abhängigkeiten in den Messwerten, 
die nicht auf das Training zurückzuführen sind und deshalb für die Interpreta- 
tion der Ergebnisse nicht relevant sind. Um diese Abhängigkeiten statistisch zu 
kontrollieren, werden anstelle von multiplen linearen Regressionen, hierarchi- 
sche lineare Regressionen berechnet. Dazu wurden die Daten aus einer multiva- 
riaten Darstellung in eine univariate überführt, wobei die Testwerte der ver- 
schiedenen Messwerte jedem Kind über eine ID-Variable und jedem Messzeit- 
punkt über eine Messzeitpunktvariable zugeordnet werden. Die PG dient als 
Konstante, sodass positive oder negative Veränderungen zwischen den Mess- 
zeitpunkten als Regressionsgewicht beschrieben werden können. Die Verände- 
rungen werden dabei als Interaktionseffekte zwischen der Messzeitpunkt- 
variable und weiteren Prädiktoren modelliert, sodass die Regressionsgewichte 
die unterschiedliche Entwicklung der Gruppen in Abhängigkeit weiterer Prä- 
diktoren beschreiben (Hilbert, Stadler, Lindl, Naumann & Bühner, 2019). Ein 
erstes hierarchisches lineares Modell untersucht, ob sich eine Verwendung der 
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FiLBY-Materialien im Distanzunterricht gegenüber anderen Materialien als 
wirksamer für die Entwicklung des Leseverstehens erweist. Mit Hilfe eines 
zweiten Modells wird analysiert, welche Umsetzungsvarianten des FiLBY-3- 
Trainings sich wie auf die Entwicklung des Leseverstehens auswirken. Zur Kor- 
rektur für die sich so ergebenden multiplen Signifikanztests der Regressionsko- 
effizienten wird eine Bonferroni-Holm-Korrektur vorgenommen (Holm, 1979). 


7 Ergebnisse 


7.1 Forschungsfrage 1 


In Hinblick auf die erste Forschungsfrage wird analysiert, wie Grundschullehr- 
kräfte während der Schulschließungen Arbeitsaufträge vermittelten, welche 
organisatorischen Informationen sie beifügten und welche Unterstützungsan- 
gebote den Kindern zur Verfügung standen. Es wird darüber hinaus untersucht, 
wie die Lehrkräfte die Unterstützungsfähigkeiten der Eltern einschätzten und 
wie viel Unterrichtszeit für das Lesen veranschlagt wurde. Dabei wird vergli- 
chen, wie sich die Lehrkräfte der TG von denen der PG unterscheiden (für eine 
detaillierte Übersicht vgl. OSF: https://osf.io/9cspz/). 

Die Lehrkräfte beider Gruppen nutzten jeweils mehrere Kommunikations- 
kanäle, um mit den Kindern bzw. den Erziehungsberechtigten in Kontakt zu 
bleiben und das Lernen zuhause zu organisieren, z. B. Clouddienste, E-Mails 
oder Videokonferenzen. Im Vergleich zur PG ließen die Lehrkräfte der TG die 
Arbeitsmaterialien (z. B. die FiLBY-Trainingshefte) häufiger abholen oder ver- 
schickten diese per E-Mail. Die Lehrenden der PG verschickten eher Kopien 
bzw. brachten diese den Kindern selbst vorbei. 

Die Arbeitsmaterialien versahen die Lehrkräfte überwiegend mit zusätzli- 
chen Informationen, z. B. Hinweise zur inhaltlichen Strukturierung. Die Unter- 
schiede zwischen TG und PG fallen diesbezüglich gering aus. In beiden Grup- 
pen bildeten allgemeinere Unterstützungsangebote wie Hinweise zu Kontakt- 
möglichkeiten oder Differenzierungsmöglichkeiten einen Schwerpunkt. Nur 
wenige der Lehrkräfte boten den Kindern allerdings konkrete Strategien zur 
Erarbeitung, Anregungen zur Lernreflexion oder Lernziele an. Auffällig ist, dass 
die Lehrperson der TG häufiger angaben, auf Strategien und schriftliches Feed- 
back zu setzen. 

Fast alle Lehrkräfte schätzten das Unterstützungspotenzial der Eltern bei der 
Lernorganisation befriedigend bis gut ein und trauten ihnen auch die inhaltli- 
che Unterstützung zu. Die Lehrerinnen und Lehrer der Pseudokontrollgruppe 
trauten den Erziehungsberechtigten in der Tendenz etwas mehr zu als ihre 
Kolleginnen und Kollegen der FiLBY-Gruppe. Ein systematischer Zusammen- 
hang der Bearbeitungshinweisen und dem eingeschätzten Unterstützungs- 
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potenzial der Eltern kann jedoch nur hinsichtlich der Formulierung von Lern- 
zielen festgestellt werden: Die Lehrpersonen gaben seltener Lernziele an, wenn 
sie die Eltern als kompetent empfanden (r = -.2). Zwischen der Wahl der 
Kommunikationswege und zusätzlich angebotenen Informationen bestehen 
keine Zusammenhänge. Die teilnehmenden Lehrkräfte fühlten sich überwie- 
gend sicher bis sehr sicher im Umgang mit Medien. 

Zusammenfassend lässt sich sagen, dass Lehrkräfte, die mit den FiLBY-Ma- 
terialien weiterarbeiteten, dem Lesen einen höheren Stellenwert zumaßen, 
mehr Zeit für das Lesen reservierten und die Schülerinnen und Schüler besser 
informierten. Dafür war der persönliche Kontakt weniger umfangreich. Diese 
Lehrerinnen und Lehrer setzten stattdessen stärker auf das selbstständige Ar- 
beiten der Kinder mit den vorstrukturierten FiLBY-Materialien und schriftli- 
ches Feedback. Systematische Zusammenhänge mit der positiveren Einschät- 
zung der eigenen Medienkompetenz oder dem geringer eingeschätztem Unter- 
stützungspotenzial der Eltern lassen sich jedoch nicht nachweisen (s. Tabelle 2). 


Tabelle 2: Zusammenhänge zwischen Einschätzung von Medienkompetenz und orga- 
nisatorischem Unterstützungspotenzial der Eltern und Art des Feedbacks in der FiLBY- 
Gruppe (Kendall-t-Koeffizient) 


: z Korrektur Korrektur 
Korrelation nach Kendall Musterlösung schriftlich mündlich 
Medienkompetenz der Lehrkräfte -.01 -.11 .23 
Unterstützungspotenzial Eltern -.11 .17 .20 


7.2 Forschungsfrage 2 


Zur Untersuchung der zweiten Forschungsfrage wird analysiert, ob eine Ver- 
wendung der FiLBY-Materialien gegenüber der Verwendung anderer Leseför- 
dermaterialien während der Schulschließungen generell förderlicher war. In der 
hierarchisch linearen Regression gibt die Konstante an, mit welcher Leistung 
die PG gestartet ist. Es wurden vier Effekte geschätzt: Der Effekt „Messzeit- 
punkt“ ist ein Schätzer für den Fortschritt der Kinder der PG während des Er- 
hebungszeitraums. Der Effekt „Gruppe“ zeigt den mittleren Leistungsunter- 
schied zwischen PG und TG vor dem Training an, der Interaktionseffekt zwi- 
schen Messzeitpunkt und Gruppe „Messzeitpunkt x Gruppe“ gibt an, wie sich 
die TG im Vergleich zur PG entwickelt hat. Die Gesamtveränderung der TG 
ergibt sich also aus der Summe „Messzeitpunkt“ + „Messzeitpunkt x Gruppe“. 
Tabelle 3 zeigt, dass sich kein signifikanter Vorteil der TG gegenüber der PG 
während der Schulschließungen ergibt. Die Leseförderung der TG war dem- 
nach der der PG während des Distanzunterrichts scheinbar nicht überlegen. 
Die Intraklassenkorrelation (ICC) gibt im Modell an, wie viel Prozent der Feh- 
lervarianz auf die geschachtelte Datenstruktur zurückzuführen war. Der (hohe) 
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Wert von 0.55 zeigt, dass die meisten Schülerinnen und Schüler sich während 
des Erhebungszeitraums ahnlich entwickelten (leistungsstarke Schiilerinnen 
und Schüler gehören weiterhin zu den leistungsstarken) und die Leistungsent- 
wicklung zudem mit der Klassenstruktur assoziiert war (z. B. Klassen mit gro- 
Bem bzw. kleinem Leistungszuwachs). 


Tabelle 3: Fortschritte im Leseverstehen in Abhängigkeit der Gruppenzugehörigkeit 


Modelle 

Nullmodell Volles Modell 
Feste Effekte b p-Wert b p-Wert 
Konstante 100.01 <.001 99.99 <.001 
Gruppe - - -0.93 ‚472 
Messzeitpunkt - - 0.50 ‚516 
Messzeitpunkt x Gruppe - - 0.58 ‚576 
Zufällige Effekte o? o? 
1CCsubjekt:Klasse .54 .55 
R? marginal - .001 
R? konaitionai z 55 


Anmerkung. b = Regressionskoeffizient, TG = Trainingsgruppe, MZP = Messzeitpunkt, ICC = Intraklassen- 
korrelation, o = Varianz, x bezeichnet Interaktionseffekte, N = 1495 Schülerinnen und Schüler, 85 Klas- 
sen. 


Die Fragebogenerhebung demonstrierte, dass die Lehrkräfte spezifische Anpas- 
sungen des FiLBY-3-Trainings vorgenommen hatten. In einer zweiten Analyse 
wird daher untersucht, welche Elemente der Trainingsdurchführung die Wirk- 
samkeit des FiLBY-Trainings im Distanzunterricht beeinflussten. Dazu wird die 
TG nochmals nach der Art der Trainingsanpassung unterteilt: Eine Gruppe 
bilden dabei die Schülerinnen und Schüler, denen die Strategien wie im Trai- 
ning vorgesehen von der Lehrkraft noch im Präsenzunterricht persönlich ver- 
mittelt worden waren (11.0%). Rund ein Viertel der Schülerinnen und Schüler 
arbeitete mit den Trainingsheften, ohne dass zuvor Lesestrategien vermittelt 
worden waren (26.7%). Etwa ein Fünftel der Kinder sollte sich die Strategien 
durch Erklärvideos aneignen (22.4%), ein kleinerer Teil der Lernenden erhielt 
dazu Erklärtexte (12.8%; vgl. Tabelle 4). Andere Einzelfallnennungen sind in 
dieser Analyse nicht berücksichtigt. 
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Tabelle 4: Verteilung der FiLBY-Gruppe über die Kategorien der Arbeit mit den FiLBY- 
Materialien (absolut und in Prozent) 


ae es Erklar- Erklar- Leseflüssig- ohne Strategien 

: g text f. video f. keits- Strate- per Video- | gesamt 

im Unter- ; $ Da ; 

richt Strategien | Strategien training gien konferenz 

nn. j 92 107 187 63 223 o en 
nen (11.0%) (12.8%) (22.4%) (7.5%) (26.7%) (0%) 
Anzahl 5 5 10 3 13 (0) 36 
Klassen (13.9%) (13.9%) (27.8%) (8.3%) (36.1%) (0%) 


Anzahl Missings (Kategorie: Sonstige): 164 Schüler/-innen, 11 Klassen 


Als Referenzkategorie (Konstante) dient in diesem Modell die Strategieeinfüh- 
rung durch die Lehrkraft selbst im Präsenzunterricht. Die Gruppe machte wäh- 
rend des Erhebungszeitraums 5.74 BYLET-Normpunkte Fortschritt (,,Mess- 
zeitpunkt“). Die Interaktionseffekte der Prädiktoren (Anpassungen des Trai- 
nings) und des Messzeitpunkts können also als Entwicklungsunterschied zu 
dieser Gruppe interpretiert werden. Der Interaktionseffekt aus Messzeitpunkt 
und Erklärtext („Messzeitpunkt x Erklärtext“; b = -5.43) bedeutet beispiels- 
weise, dass Kinder, die mit Erklärvideos arbeiteten, weniger profitieren konnten 
als Kinder, die Strategien im Unterricht vermittelt bekamen. Sie steigerten sich 
im Vergleich dazu lediglich um 0.31 Normpunkte (0.31 = 5.74 - 5.43; Werte 
„Messzeitpunkt“ und „Messzeitpunkt x Erklärtext“). 


Abbildung 3: Entwicklung des Leseverstehens in Abhängigkeit der Anpassungen des 
FiLBY-3 Trainings in der EG während der Corona-Pandemie 
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Messzeitpunkt 


Die Balken kennzeichnen die Standardfehler der Regressionsgewichtsschätzungen. 
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Abbildung 3 zeigt, dass die von den Lehrkraften genutzten Alternativen im 
Vergleich zur Strategieeinführung in Präsenz signifikant kleinere Zuwachse im 
Leseverstehen aufweisen - lediglich der Einsatz von Erklartexten hat keine 
signifikanten Nachteile. Weder der Einsatz von Erklärvideos kann die Ver- 
mittlung durch die Lehrkraft ersetzen, noch erweist sich der Verzicht auf Stra- 
tegien als sinnvoll. Als besonders nachteilig entpuppt sich ein erneutes Training 
der Leseflüssigkeit, zumal die teilnehmenden Kinder diese bereits in der zwei- 
ten Jahrgangsstufe trainiert hatten. Hier beträgt der Effekt fast eine Standard- 
abweichung (ca. 15 Normpunkte). Die genauen Modellkennwerte und Regres- 
sionsgewichte der Analyse sind aus Tabelle 5 ersichtlich. 


Tabelle 5: Fortschritte im Leseverstehen nach Durchführungsmodalität des FiLBY-3- 
Trainings 


Modelle 
Nullmodell Volles Modell 

Feste Effekte b p-Wert b p-Wert a A 
Konstante 99.77 | <.001 | 100.48 | <.001 <.001 
Messzeitpunkt - - 5.74 | <.001 .001 
Messzeitpunkt x Erklärtext - - -4.40 .055 .055 
Messzeitpunkt x Erklarvideo - - -5.43 .022 .044 
Messzeitpunkt x ohne Strategien - - -7.50 | <.001 <.001 
m Leseflüssigkeits- z _ 13.54 | <.001 < 001 
Zufällige Effekte o? o? 
1CCsubjekt:klasse 55 50 
R” iarainal - .04 
R? konditional 7 .52 


Anmerkung: * Bonferroni-Holm-Korrektur, b = Regressionskoeffizient, MZP = Messzeitpunkt, 
ICC = Intraklassenkorrelation, o= Varianz, x bezeichnet Interaktionseffekte, N = 669 Schülerinnen und 
Schüler, 36 Klassen. 


8 Diskussion 


Ziel der Untersuchung war es, die Einflüsse des Lernens zuhause auf die Ent- 
wicklung des Leseverstehens von Grundschülerinnen und Grundschülern zu 
untersuchen. 

Die Lehrkräfte reagieren in Hinblick auf die Leseförderung durchwegs flexi- 
bel auf die Situation des Distanzlernens. Die Lehrkräfte, die während der Schul- 
schließungen mit FiLBY weiterarbeiteten, maßen der Leseförderung dabei ei- 
nen höheren Stellenwert bei und investierten mehr Zeit in das Lesen als diejeni- 
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gen, die das FiLBY-Material nicht einsetzten. Beide Gruppen nutzten verschie- 
dene Kommunikationswege und versuchten größtenteils, den persönlichen 
Kontakt aufrechtzuerhalten. Da das FiLBY-Material für Schülerinnen und 
Schüler gut vorstrukturiert ist, setzten die Lehrpersonen der Trainingsgruppe 
stärker auf die Selbstständigkeit der Kinder und die Unterstützung durch die 
Erziehungsberechtigten. Wie bereits in anderen Untersuchungen (z. B. Besa, 
Gensler, Gesang & Röhrig, 2020) spielt die Unterstützung durch die Erzie- 
hungsberechtigten keine Rolle für die Entwicklung der Schülerinnen und 
Schüler. 

Die weiteren Analysen zeigen, dass sich die veränderten Lernbedingungen 
in der Phase der Schulschließungen ungünstig auf den Fortschritt der Kinder 
im Leseverstehen auswirkten. Es gelingt den Kindern im Distanzunterricht 
offensichtlich nicht, sich Lesestrategien selbstständig anzueignen bzw. diese 
ohne Hilfe zu üben, sodass die Trainingsgruppe zunächst keine Vorteile aufzu- 
weisen scheint. Die teilnehmenden Lehrerinnen und Lehrer passten jedoch das 
FiLBY-3-Training ihrer Situation an. Dass während der Schulschließungen die 
technischen Mittel noch begrenzt waren, viele Lehrkräfte Videokonferenz- 
software kaum nutzen konnten, um die Strategien einzuführen oder gemeinsam 
mit Schülerinnen und Schüler zu üben, erschwerte den Lehrkräften das syste- 
matische Training. Es ist deshalb zu vermuten, dass vor allem die Lehrkräfte 
das Training nicht durchführten, die noch nicht damit begonnen hatten. 

Die Lehrkräfte, die mit FiLBY-3 weiterarbeiteten, ersetzten die Strategie- 
einführung in Präsenz durch Alternativen wie beispielsweise das Lesen ohne 
Strategien, Erklärtexte und Erklärvideos sowie weitere Leseflüssigkeitsübungen 
analog zu FiLBY-2, die im Vergleich jedoch ungünstige Effekte für das Lesever- 
stehen aufweisen. Möglicherweise auch deshalb, weil aufgrund der fehlenden 
Kontrolle der Lehrkraft nicht alle Lernenden in der Lage waren, die mit den 
Anpassungen verbundenen Lernchancen selbstständig wahrzunehmen. Dies 
betont die Rolle der Lehrkraft für die Strategievermittlung: Das effektive Lernen 
zuhause erfordert ein hohes Maß an Selbstregulation (Köller et al., 2020) und 
stellt hohe Ansprüche an strukturelle (wie z. B. Verfügbarkeit schnellen Inter- 
nets) sowie soziale (z. B. Ansprechbarkeit der Lehrkraft) Ressourcen (Casale et 
al., 2020; Reiss, 2020), was viele Kinder zu überfordern scheint. Insbesondere 
scheint außerdem die Kontinuität des Trainings für der Erfolg wichtig zu sein. 
Das zentrale Element einer gelingenden Förderung des Leseverstehens während 
des Distanzunterrichts ist demnach die Einführung der Lesestrategien durch die 
Lehrkraft. Dies deutet darauf hin, dass schwächere Leserinnen und Leser zwar 
in besonderem Maße auf die Hilfe der Lehrperson angewiesen sind (Schilcher, 
Wild, Kraus & Hilbert, in Druck), für den Erwerb von Lesestrategien jedoch alle 
Kinder das Expertenmodell der Lehrkraft benötigen. Sind die Strategien 
eingeführt, können weitere Übungsphasen mit einem geringeren Grad an 
Unterstützung gestaltet werden. 
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Bemerkenswert sind die geringen Fortschritte im Leseverstehen, die diejeni- 
gen Klassen erreichten, die anstelle des Lesestrategietrainings weiter die Lese- 
flüssigkeit trainierten. Zwar besteht ein theoretischer Zusammenhang zwischen 
Leseflüssigkeit und Leseverstehen, wenn aber die basalen Prozesse hinreichend 
flüssig bewältigt werden, trägt ein weiteres Training der Leseflüssigkeit nicht 
mehr maßgeblich zum Leseverstehen bei (Afflerbach, Pearson & Paris, 2008). 
Weitere, hier nicht berichtete, Analysen zeigen allerdings, dass ein solches 
Training durchaus noch signifikant positive Effekte bezüglich der Leseflüssig- 
keit aufweisen kann (vgl. OSF: https://osf.io/9cspz/). Dies dürfte u. a. auf einen 
Aufholeffekt der schwächeren Schülerinnen und Schüler zurückzuführen sein. 

Bei der Interpretation der Ergebnisse müssen folgende Einschränkungen 
bedacht werden: Aufgrund der akuten Pandemiesituation konnten nur die 
Daten zweier Messzeitpunkte herangezogen werden, was die untersuchte 
Gruppe auf Kinder der dritten Jahrgangsstufe beschränkt. Es konnten außer- 
dem nur Lehrpersonen der Experimentalgruppe befragt werden. Die berichte- 
ten Ergebnisse beruhen überwiegend auf der Perspektive dieser Lehrkräfte. 
Darüber hinaus ist denkbar, dass die für den Distanzunterricht entwickelten 
Lernangebote von den Schülerinnen und Schülern nicht wie vorgesehen ge- 
nutzt wurden, etwa wenn hilfreiche Erklärvideos zur Strategievermittlung zwar 
zur Verfügung gestellt, aber von den Kindern nicht abgerufen wurden. 
Weiterer Forschungsbedarf ergibt sich außerdem in Hinblick auf verschiedene 
Schülergruppen, etwa mit unterschiedlichem Leistungsniveau, sozioökonomi- 
schen Hintergrund oder Migrationshintergrund. 
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Synthesen schreiben - eine textbasierte 
Längsschnittuntersuchung studentischer 
Lese- und Schreibperformanz 


Alex Rickert & Maik Philipp 


Zusammenfassung: In der Forschung zum Schreiben von Diskurssynthesen ist noch 
wenig geklärt, wie sich kognitive Prozesse des Auswählens, Verknüpfens und Organi- 
sierens in Texten niederschlagen, wie diese miteinander zusammenhängen und wie sie 
mit der Textqualität korrelieren. In unserer Untersuchung haben wir diese Fragen 
adressiert, indem wir ausgehend von Textprodukten kognitive Prozesse rekonstruiert 
haben. Dafür haben wir Diskurssynthesen von 25 Lehramtsstudierenden der Kinder- 
garten-, Primar und Sekundarstufe zu zwei Messzeitpunkten analysiert und daraus 
Rückschlüsse auf die genannten kognitiven Prozesse gezogen. Die Resultate zeigen, 
dass das Verknüpfen und Organisieren von Inhalten den Studierenden am meisten 
Schwierigkeiten bereiteten, Verknüpfungsprozesse aber gleichzeitig am stärksten mit 
der Textqualität zusammenhängen. Zudem zeigt die Empirie, dass Auswahl-, Verknüp- 
fungs- und Organisationsprozesse entgegen theoretischen Annahmen wenig miteinan- 
der verbunden zu sein scheinen. 


Schlüsselwörter: Diskurssynthese, kognitive Prozesse, Auswählen, Verknüpfen, Orga- 
nisieren 


Abstract: In research on writing discourse syntheses, there is still little consensus of 
how cognitive processes of selecting, connecting and organizing are reflected in texts, 
how they are interrelated, and how they correlate with text quality. In our study, we 
addressed these questions by means of reconstructing cognitive processes by analy- 
zing written products. For this sake, we examined discourse syntheses of 25 student 
teachers at kindergarten, primary and secondary school level at two measurement 
time points and drew conclusions about the cognitive processes. The results show that 
the connection and organization of contents caused the most difficulties for the test 
persons, but the process of connecting was also most strongly related to text quality. 
Moreover, empirical evidence shows that, contrary to theoretical assumptions, pro- 
cesses of selection, connection and organization seem to be little interrelated. 


Keywords: discourse synthesis, cognitive processes, selecting, connecting, organizing 
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1 Einleitung 


Die Fähigkeit, aus verschiedenen Texten zu lernen und Informationen schrift- 
lich weiterzuverarbeiten, gewinnt in Bildungs- und Berufskontexten an Bedeu- 
tung. Längst hat sich ein neues Forschungsfeld etabliert, das den versierten 
Umgang mit multiplen Texten zu kartieren beginnt: dasjenige der „multiple 
document literacy“ (List & Alexander, 2019). Diese Fähigkeit, mehrere einzelne 
Dokumente zu Zwecken der Bewältigung von Aufgaben sinnvoll zu nutzen, 
zieht aus Produkt- und Prozessperspektive immer mehr Aufmerksamkeit auf 
sich (Primor & Katzir, 2018), zuletzt sogar bei PISA 2018. Auch die Schreibfor- 
schung hat sich unter dem Stichwort „Diskurssynthese“ dem Hybrid aus Lesen 
und Schreiben intensiver gewidmet (van Ockenburg et al., 2019). 

Einigkeit besteht darin, dass hybride Lese- und Schreibprozesse als interak- 
tive strategische Prozesse zusammenwirken müssen, damit Personen erfolg- 
reich einen eigenen Text herstellen können, der auf mehreren gelesenen Texten 
basiert und zur Aufgabenstellung passt (Philipp, 2020). Es sind also Lese- und 
Schreibforschung gleichermaßen gefragt, Prozesse und Produkte theoretisch zu 
fassen, empirisch zu erforschen und didaktisch zu fördern. 

Dieser Beitrag greift dies auf. Er widmet sich im Sinne der Grundlagenfor- 
schung der Frage, ob sich theoretisch postulierte Prozesse in studentischen 
Diskurssynthesen rekonstruieren lassen, wie sie sich im kurzen Längsschnitt 
verändern und wie solche produktbezogenen Maße - darunter auch solche aus 
dem Kontext der Schreibforschung - zusammenhängen. Hierfür haben wir 25 
Studierende zweimal im Abstand von drei Monaten dieselben Syntheseaufga- 
ben bearbeiten lassen und die Produkte mehrdimensional analysiert. Aus pro- 
duktbezogenen Analysen haben wir Rückschlüsse auf kognitive Prozesse des 
Auswählens, Verknüpfens und Organisierens gezogen (Primor & Katzir, 2018; 
Segev-Miller, 2007). 

Der Beitrag hat folgenden Aufbau: Wir gehen zunächst auf die Trias kogni- 
tiver Prozesse bei den Diskurssynthesen ein (Kapitel 2) und verdeutlichen die 
kognitiv anspruchsvollen Erfordernisse für das Lesen und Schreiben. Dabei 
greifen wir auf die in der Studie zum Einsatz gelangte Aufgabe und auf einen 
studentischen Text aus dem Korpus zurück. Im Kapitel 3 legen wir unsere Me- 
thodik ausführlich dar und präsentieren im Kapitel 4 die Befunde zu unseren 
sechs Fragestellungen. Das kurze Fazit in Kapitel 5 bündelt und diskutiert die 
Essenz, wobei Forschungsdesiderate skizziert werden. 
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2 Kognitive Prozesse beim Schreiben von Diskurssynthesen 


Schreibprozesse, die mehrere konvergierende oder konfligierende Texte oder 
Dokumente zur Grundlage haben, werden als „writing from sources“, „mate- 
rialgestütztes Schreiben“ oder „schriftliches Synthetisieren“ bezeichnet. Ein 
prototypisches Resultat, das aus solchen Lese- und Schreibprozessen resultiert, 
ist die Diskurssynthese. Unter Diskurssynthese versteht Nelson (2001) einen 
Diskurs (verbale Abhandlung eines Themas), der durch Synthese (Kombinieren 
und Abgleichen) anderer Diskurse hervorgeht. Verfasserinnen und Verfasser 
von Diskurssynthese konstruieren einen Text mit eigener Struktur, der auf 
Inhalte aus anderen Texten zurückgreift und diese für eigene Textziele relevant 
setzt und transformiert. 


2.1 Ein Einstiegsbeispiel 


Dies lässt sich leicht mit einem Beispiel verdeutlichen, das wir zur Entfaltung 
der Thematik im Folgenden nutzen möchten. Es handelt sich dabei um die in 
unserer Studie zum Einsatz gelangte Aufgabe (s. Kasten 1) und eine aus dem 
Pool der entstandenen Synthesen stammende Lösung (Kasten 2). Wir nutzen 
dieses Beispiel, um im Folgenden auf die Erfordernisse des materialgestützten 
Schreibens einzugehen, wenn es um die Prozesse geht, welche für diesen Um- 
gang mit multiplen Dokumenten typisch sind. Unterschiede zwischen den Be- 
zugstexten hinsichtlich Textschwierigkeit werden in Teilkapitel 3.3.1 erläutert. 


Kasten 1: Arbeitsauftrag und Bezugstexte für eine Aufgabe zum schriftlichen 
Synthetisieren 


Arbeitsauftrag 

Bitte schreiben Sie eine Synthese über die beiden unteren Texte, welche die geäußerten 
Standpunkte von F. Mole und M. Crahay berücksichtigt. Ihre Synthese soll diese Frage 
beantworten: Wofür gibt es die Schule und was sind ihre Ziele? Erklären Sie ihre Funktion. 
Bedenken Sie bitte, dass eine Synthese die Funktion hat, die Positionen aus beiden Texten 
angemessen wiederzugeben und Gemeinsamkeiten und Unterschiede in den Positionen 
zu verdeutlichen. Ihr Text sollte rund 2000 Zeichen (inkl. Leerzeichen) umfassen. 


Text 1 
Mole, F. (2013). Die einzelne Schule: kollektive oder individuelle Emanzipation? Von den 
Anfängen des 20. Jahrhunderts bis in die 1930er. La Télémaque, 103-104. 


[1] „Emanzipation durch Schule.“ Zusätzlich zu seiner [2] intellektuellen Bedeutung hat 
dieser Ausdruck eine [3] soziale Bedeutung, die man entweder aus einer [4] kollektiven 
Perspektive oder von einem [6] persönlichen Standpunkt verstehen kann. Gemäß der [4] 
kollektiven Perspektive [5] sollte Schule junge Menschen ermutigen, alle charakterlichen 
Züge der Unterordnung zu verbannen, um politisch autonomer zu werden. [6] Gemäß dem 
individuellen Standpunkt [7] gibt Schule den Individuen eine Möglichkeit, um sich von 
ihrem sozialen Hintergrund zu befreien. [8] Es gibt zwei verschiedene französische republi- 
kanische Sichtweisen der Bildung: 
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[9] 1) Schule muss die Bedingungen schaffen, die man benötigt, um politische und soziale 
Demokratie zu fördern, [10] indem man die intellektuellen Ressourcen der Menschen 
entwickelt. Erstgenannte wird als kollektives, beherrschtes Gebilde betrachtet, das frei von 
jeder Art von Autorität ist und seine Souveränität ausübt. Ein Jahrhundert nach Concordet 
sagte Jaurés*, dass Bildung Individuen erlaubt, zu agieren, um eine bessere Republik und 
eine gerechtere Gesellschaft zu schaffen. 

[11] 2) Schulen müssen Individuen hervorbringen, die fähig sind, menschliche Belange in 
einer Gesellschaft zu behandeln, in der Funktionen und Status nicht das Ergebnis von 
Zufall sind. [12] Seit dem Beginn des 20. Jahrhunderts haben Reformatoren die Grenzen 
kritisiert, die zwischen verschiedenen Kontexten bestehen, und für eine stärker vereinte 
Art der Bildung plädiert, indem man die Gemeinschaft erweitert, aus der die Mitglieder der 
Elite rekrutiert werden und das Land sein Humankapital? entwickelt, und gleichzeitig alle 
Individuen gerecht behandelt. 


1 Concordet schlug vor, durch allgemeine Bildung den Menschen die Hilfsmittel zu geben, 
um „eine perfektere Verfassung zu erhalten“, und Jaur&s behauptete, dass der „Sozia- 
lismus eine Konsequenz der sukzessiven Bürgerrechte zu sein scheint“ (Der sozialisti- 
sche Staat und Funktionäre, La Revue Socialiste, 21, 124, April 1985, S. 387-388). 

F. Buisson, L. G&rard-Varet, J. Bouveri, Gesetzentwurf zu den gleichen Rechten in der 
Bildung für Kinder, (Frankreich: Repräsentantenhaus, 9. Legislatur, Sitzung von 1910, 
Nr. 3265), S. 8. 


Text 2 
Crahay, M. (2000). Können Schulen fair und effizient sein? Von der Chancengleichheit zur 
Gleichheit der Ergebnisse. Brüssel: De Boeck & Larcier. 


Gemäß Dubet und Martuchelli (1996) haben [13] alle Schulsysteme drei wichtige Funktio- 
nen zu erfüllen und können danach definiert werden, wie sie Funktionen hierarchisieren 
und artikulieren. 

[14] Die erste Funktion - Bildung - ist verbunden mit den [15] persönlichen Projekten der 
Schüler, die, [16] insofern sie zur Reflexion fähig sind, [15] diese Projekte selbst regulieren 
und bestimmen, [16] indem sie Situationen, in denen sie sich befinden, rational analysie- 
ren. Durkheim (1990) hat speziell diese Dimension hervorgehoben, indem er daran erin- 
nerte, dass Schulen das Produkt eines christlichen Projekts sind, Individuen in ein anderes 
Leben zu überführen. 

[17] Die zweite Funktion ist Sozialisation. [18] Schulen sollten das Aufkommen von Indivi- 
duen fördern, die an die Gesellschaft angepasst sind. [19] Für dieses Ziel müssen Schulen 
die Normen, Gewohnheiten, Wissensbestände und Werte integrieren, die von der sozialen 
Gruppe geschätzt wird, in der diese Individuen Mitglieder werden sollen. 

[20] Die dritte Funktion ist Verteilung. Dies [22] „betrifft die Rollen, die die Schule erfüllt 
bezüglich der Abschlüsse, die einen sozialen Nutzen haben aufgrund des Fakts, dass 
bestimmte Jobs, Positionen und Status das Vorrecht der Akademiker sind. [21] Die Schule 
verteilt Vermögensbestände, die einen bestimmten Wert in den Arbeitsmärkten und der 
sozialen Hierarchie haben“ (Dubet und Martucelli, 1996, S. 23). 


(Quelle: Übersetzung und leichte Modifikation von Escorcia et al., 2017, S. 269 f.; 
Zahlen in eckigen Klammern geben an, welche Propositionen aus der Musterlösung unserer Studie an 
welcher Stelle im Text vorkommen; das Lesemodell ist dargestellt in Abbildung 1 in Teilkap. 3.3.1) 
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Kasten 2: Authentische studentische Synthese zur Aufgabe aus Kasten 1 


Synthese (studentischer Text) 

F. Mole beschreibt in seinem Text die Funktion der Schule aus zwei Perspektiven. Aus der 
[4] kollektiven Perspektive betrachtet, soll die Schule junge Menschen dazu [5] ermutigen 
charakteristische Züge der [37] Unterordnung zu verbannen, um sich so politisch autono- 
mer in der Gesellschaft zu bewegen. Dies steht im Widerspruch zur Aussage von M. Cra- 
hay, der als eine [13] der drei Funktionen der Schule die [17] [34] [35] Sozialisation sieht, 
welche [18] Individuen hervorbringen soll, die an die Gesellschaft angepasst sind. Die 
Individuen sollen sich also nach M. Crahay unterordnen und [19] sich den Werten, Normen 
und Gewohnheiten und Wissensbeständen der entsprechenden Gesellschaft anpassen 
und nicht völlig autonom verfügen können. Jedoch beschreibt auch Crahay, dass es den- 
noch zur Aufgabe der Schule gehört, die Schüler und Schülerinnen in ihrer [15] persönli- 
chen Entwicklung zu unterstützen, damit sie sich selbstreguliert und selbstbestimmt ent- 
wickeln können, jedoch unter der Voraussetzung, dass sie sich den bereits erwähnten 
gesellschaftliche Kriterien fügen. 

[31] [6] Bei_der individuellen Perspektive liegt das [7] Augenmerk auf der Befreiung vom 
sozialen Hintergrund. [32] Es soll nach Mole unter anderem [11] kein Zufall sein, welche 
Funktion oder welchen Status ein Individuum erlangt. [29] [30] Diesen Punkt widerlegt 
Crahay in der Beschreibung der dritten Funktion der Schule, der [20] Verteilung. Hiernach 
sind die Rollen betroffen, die die Schule gemäß den [22] Qualifikationen erfüllt, die vor 
dem Hintergrund des Faktes einen sozialen Nutzen haben, dass bestimmte Jobs, Positio- 
nen und Status das Vorrecht der Akademiker sind. Zudem sei es Aufgabe der Schule, [21] 
Vermögensbestände zu verteilen, die einen bestimmten Wert in den Arbeitsmärkten und 
der sozialen Hierarchie haben. Dieser Ansicht nach wird eine Loslösung vom sozialen 
Hintergrund nicht angestrebt, sondern orientiert sich stark nach dem sozialen Hintergrund 
des einzelnen Individuums. 

Abschließend soll aber erwähnt werden, dass Mole wie auch Crahay sich aber in einem 
Punkt einig sind und zwar, dass [23] die Schule die ganz allgemeine Aufgabe hat, Men- 
schen in ihrer Entwicklung zu begleiten und zu fördern. 


(Eckige Zahlen geben die Propositionen aus der Benchmarklösung in Abbildung 1 an; Zahlen von 1 bis 12 
beziehen sich auf den Bezugstext 1, Zahlen von 13 bis 22 auf den Bezugstext 2 und Zahlen von 23 bis 38 
auf das integrierte mentale Modell. Die Unterstreichungen markieren Textstellen mit Bezügen zur Bench- 

marklösung.) 


2.2 Drei Prozesse im Verbund 


Das Verfassen von Diskurssynthesen ist hochgradig strategisch, was aus der 
Zahl und Vernetztheit kognitiver und metakognitiver Prozesse beim Lesen und 
beim Schreiben resultiert. Spivey (1990) benennt drei Prozesse: das Auswählen, 
das Organisieren und das Verknüpfen. Wir werden diese drei Prozesse im Fol- 
genden beschreiben und dabei zunächst das Lesen und danach das Schreiben 
thematisieren. 


2.2.1 Auswählen 


Das Auswählen bezeichnet einen kognitiven Gewichtungsvorgang, der die Se- 
lektion der textuellen Inhaltseinheiten (Propositionen) steuert. Diesem Ge- 
wichtungsvorgang liegt also die Analyse der in den Texten enthaltenen Propo- 
sitionen zugrunde (Philipp, 2018). Im Falle des Lesens gilt es, aus Texten jene 
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Bedeutungseinheiten zu extrahieren, die in einer Hierarchie eine über- oder 
untergeordnete Position aufweisen. Deshalb unterscheidet man in der For- 
schung zwischen sogenannten intratextuellen Mikro- und Makropropositionen 
(Kintsch & van Dijk, 1978) - im Falle des Texts 2 aus dem Kasten 1 wären sol- 
che Makropropositionen die drei explizit genannten Funktionen der Schule, die 
sogar noch typografisch durch Kursivierungen hervorgehoben wurden. 

Die Gewichtung von Propositionen beim Lesen vollzieht sich häufig auf der 
Basis von textseitig rekonstruierter Wichtigkeit. Verknappt ausgedrückt geht es 
darum, dass Leserinnen und Leser die Makrostruktur des Textes analysebasiert 
als propositionale Struktur unter Vorwissensbezug rekonstruieren, wobei sie 
auch implizite Aussagen durch Inferenzen anreichern (Spivey, 1990; Kintsch & 
van Dijk, 1978). Eine andere Möglichkeit, Informationen in die eigene Verar- 
beitung einzubeziehen, besteht darin, die Relevanz als Gradmesser für die Se- 
lektion zu nutzen (McCrudden, 2018). Es geht hier um eine Verwertbarkeit von 
Informationen auf der Basis textexterner, zielbezogener Einschätzungen. 

Die Auswahlprozesse des Lesens bilden die Basis für das Schreiben, wie es 
theoretische Modelle des aufgabenbasierten Lesens explizit postulieren. Das 
MD-TRACE-Modell (Rouet & Britt, 2011) etwa nimmt an, dass Zielvorstellun- 
gen (Aufgabenmodelle) für einen Text wie eine Diskurssynthese als metakog- 
nitive Filter fungieren und Prüfungs- und Entscheidungsprozesse steuern, um 
adäquate Informationen für den eigenen Text zu nutzen. 

Ein in der Forschung relativ wenig bearbeitetes Feld bezüglich der Auswahl 
an Informationen ist, welche Informationen aus welchen Texten ausgewählt 
werden. Zwar ist der Abdeckungsgrad von Makropropositionen ein recht übli- 
ches Maß (Philipp, 2020; Primor & Katzir, 2018). Gleichwohl ist es unbefriedi- 
gend, dass diese Summenwerte notwendigerweise wenig darüber aussagen, aus 
welchen Texten Personen welche Inhalte auswählen. Dadurch werden nämlich 
spezifische textseitige Merkmale bezogen auf die Einzeltextebene nicht mehr 
sichtbar. Daher widmen wir uns in dieser Studie folgender erster Forschungs- 
frage: Welchen Anteil an Propositionen übernehmen Studierende aus welcher 
hierarchischen Ebene der beiden Bezugstexte? Wir untersuchen hierfür ge- 
nauer, ob die in Bezugstexten enthaltenen Propositionen in studentischen 
Synthesen explizit oder implizit vorhanden sind und ob sie inhaltlich korrekt 
übernommen wurden. 


2.2.2  Verknüpfen 


Der zweite Prozessverbund ist das inferenzbasierte Verknüpfen, das sachlogisch 
auf dem Auswählen aufbaut und das Anwenden von abstrahierenden Makrore- 
geln des Textverstehens erfordert (Kintsch & van Dijk, 1978). Inferenzen sind 
auf Schlussfolgerungen basierende Verknüpfungsprozesse (Kendeou, 2015). 
Inferenzen sind ein mehrdimensionales Konstrukt, welches eint, dass es sich 
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um Schlussfolgerungen handelt, bei denen das Vorwissen eine entscheidende 
Rolle spielt (Philipp, 2020). Personen müssen beim Lesen selbstständig die 
Beziige zwischen Informationen innerhalb von Texten und tiber Texte hinweg 
aktiv herstellen, indem sie tibergreifende Themen als solche erkennen und ein 
integriertes mentales Modell aufbauen, welches inferenzbasierte Inhalte enthält. 
Dieses integrierte mentale Modell ist laut dem zentralen kognitionspsychologi- 
schen Modell der Leseforschung zum Verstehen multipler Dokumente, dem 
„Dokumentenmodell“ (Rouet et al., 2019), eine zentrale Ebene textbasierter 
Repräsentation und stellt die kognitive Verschmelzung von Informationen dar, 
insbesondere zu geteilten, intertextuellen Inhalten. Solche Verknüpfungspro- 
zesse können in Diskurssynthesen rekonstruiert werden. Ein Beispiel für eine 
abstrahierte Makroproposition im studentischen Text ist die Proposition [29] 
„diesen Punkt“, welche die Propositionen [11] „Bildungszugang“ und [20] 
„Verteilung“ subsummiert. 

Zum Verknüpfen zeigen lesebezogene Studien als Muster, dass es Leserin- 
nen und Leser schwerer fällt, intertextuelle Verknüpfungen vorzunehmen als 
intratextuelle (Philipp, 2020) und dass komplexe Verknüpfungen wie das Fest- 
stellen von Konflikten oder komplexere Inferenzen weniger gut geleistet wer- 
den (List et al., 2020; Philipp, 2020). 

In schreibbezogenen Studien spielen Verknüpfungen ebenfalls eine Rolle, 
sind allerdings noch kein prominenter Gegenstand. Segev-Miller (2007) spricht 
beispielsweise von „Superpropositionen“, womit sie eigenständig gebildete 
intertextuelle Propositionen meint, die in Diskurssynthesen vorkommen - also 
wenn Propositionen aus mehreren Bezugstexten durch eine einzige Makropro- 
position ersetzt wurden. Wenn solche eigenständig gebildeten Inferenzen in 
eigenen Texten vorkommen, ist dies günstig für die Qualität von Diskurssyn- 
thesen (Spivey, 1991). 

Die Frage, welche Arten von Inferenzen Personen bilden und wie sich Ver- 
knüpfungsleistungen in den Texten niederschlagen, rückt allmählich in den 
Fokus der Forschung und verdient noch mehr Beachtung (List et al., 2020). 
Deshalb lautet die zweite Fragestellung: Welchen Anteil an möglichen Inferen- 
zen aus Inhalten beider Bezugstexte realisieren Studierende in ihren Synthesen? 
Der Anteil an gebildeten Inferenzen wird analog zur ersten Fragestellung wie- 
derum nach explizitem/implizitem Vorhandensein sowie nach Korrektheit 
ausgewertet. 


2.2.3 Organisieren 


Organisieren - bzw. auch Strukturieren - bezeichnet den dritten Prozess, der 
bei der Diskurssynthese beteiligt ist. Dabei geht es darum, die Makrostruktur zu 
klären. Beim Lesen ist dies sowohl in einzelnen Texten als auch über die Texte 
hinweg wichtig. Das heißt, dass die intertextuellen Zusammenhänge von Dis- 
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kursen zu erkennen sind, damit keine unverbundenen, also nicht-integrierten 
Modelle einzelner Bezugstexte entstehen, sondern tatsächlich integrierte men- 
tale Modelle (List & Alexander, 2019). Hierbei nutzen Personen lesend und 
schreibend intratextuelle Strukturen, um intertextuelle Sinnstrukturen zu ent- 
wickeln (Barzilai & Eshet-Alkalai, 2015), sie sind aber auch gefragt, ganz eigene 
Strukturen zu entwickeln (etwa textsortenkonforme Strukturen bei Schreibauf- 
trägen), was selbst Erwachsenen noch schwerfällt (Escorcia et al., 2017; Segev- 
Miller, 2007; Spivey, 1991). Denn dazu müssen sie teils erhebliche Umstruktu- 
rierungen vornehmen, was beim Schreiben dem Planen entspricht. 

Zum Organisieren mehren sich lesebezogene Studien, die in Typologien 
oder ordinalen Skalen erfassen, welche Art von mentaler Modellbildung rekon- 
struierbar ist (s.z.B. List et al., 2020) und auch inwiefern die thematische 
Struktur die Textsortenspezifika erfüllt (Barzilai & Eshet-Alkalai, 2015; Segev- 
Miller, 2007). Auch hier zeigen sich relativ durchgängig Probleme dergestalt, 
dass eine günstige Strukturierung in aller Regel nur einem Teil der Testperso- 
nen glückt. Wir können dies am Beispiel der studentischen Synthese aus Kasten 
2 illustrieren. Die Textstruktur folgt primär der Strukturierung des ersten Be- 
zugstexts. Die Inhalte aus dem zweiten Bezugstext werden darin untergebracht, 
was ein typisches Vorgehen ist (Segev-Miller, 2007). 

Die Frage nach der Organisation verdient noch mehr Aufmerksamkeit, da 
sie eigene schwierigkeitsgenierende Merkmale hat. Deshalb widmen wir uns 
dem Organisieren mit der dritten Fragestellung unserer Studie: Welcher Grad 
an Integration zeigt sich in der Textstruktur der studentischen Synthesen zu 
beiden Messzeitpunkten? Diese Fragestellung fokussiert die Unterschiede in der 
Textorganisation und kategorisiert die Organisationsmuster entlang der reali- 
sierten intertextuellen Integration. 

In der Forschung ist bei Strukturierungsleistungen allerdings häufig unklar, 
ob das intertextuelle Integrieren ein stabiles Merkmal ist oder ob es sich um 
eine variable Fähigkeit handelt. Dies wollen wir in unserer Studie genauer er- 
gründen, indem wir die Struktur der Studierendentexte zu tl und t2 mit Blick 
auf den Grad an Integration hinsichtlich ihrer Stabilität betrachten. Zwischen 
beiden Messzeitpunkten liegt eine dreimonatige Vorlesungszeit. Von Interesse 
ist also, inwiefern sich Integrationsleistungen ohne gezielte Intervention im 
Abstand eines Semesters unterscheiden. Die vierte Fragestellung lautet: Wie 
unterscheiden sich personenbezogen die Textstrukturen in Bezug auf die ge- 
leistete Integration zu t1 und t2? 


2.2.4 Zusammenhänge zwischen den drei Prozessen 


Die vorliegende Studie fokussiert zusätzlich eine bislang empirisch unterbe- 
leuchtete Frage zu Zusammenhängen zwischen den drei Prozessen. Auswählen, 
Verknüpfen und Organisieren wirken aus theoretischer Sicht aufs Engste mit- 
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einander verbunden (Spivey, 1990). Aus empirischer Sicht ist das aber noch 
ungeklärt. Den Zusammenhängen zwischen Prozessen wird bislang wenig Be- 
achtung geschenkt. Escorcia et al. (2017) etwa erheben und unterscheiden zwar 
Auswahl- und Verknüpfungshandlungen in den Variablen „Ideen finden“ und 
„Ideen generieren“, korrelieren diese aber nicht miteinander. Auch Mateos und 
Sole (2009) unterscheiden das Auswählen von Ideen vom Integrieren und Ver- 
knüpfen von Informationen. In einem Ratingverfahren werden dann aber Aus- 
wahl-, Verknüpfungs- und Organisationsmaße in einer einzigen Variable 
(„types of synthesis“) vermengt. So ist zum einen unklar, welcher der drei Pro- 
zesse in welchem Maße zur Zuordnung einer Synthese zu einem Synthesetyp 
beiträgt, und zum andern bleibt unexpliziert, wie die Prozesse zusammenhän- 
gen. Den blinden Fleck in Bezug auf die Zusammenhänge zwischen den Prozes- 
sen wollen wir mit der fünften Fragestellung adressieren: Welche produktbezo- 
genen Zusammenhänge bestehen zwischen den Indikatoren des Auswählens 
und Verknüpfens und des Organisierens? 


2.2.5 Zusammenhang zwischen Textqualitat und den drei Prozessen 


Da Diskurssynthesen zuvorderst Texte sind, ist für die Beforschung des Syn- 
thetisierens auch die Perspektive der Schreibforschung bedeutsam. Die Text- 
qualität ist in der Schreibforschung eine wichtige Variable, um Schreibleistun- 
gen zu erfassen. Eine im Kontext des Schreibens von Synthesen bislang wenig 
beachtete Frage betrifft den Zusammenhang zwischen den drei oben skizzierten 
Prozessen und der Textqualität. Aus Interventionsstudien ist bekannt, dass 
unterschiedliche Fördermaßnamen wie textvergleichendes Lesen oder das 
Analysieren von Textstrukturen zu besseren Synthesetexten führen. Bisherige 
Befunde zum Verhältnis der Textqualität und der drei Prozesse sind bislang 
uneindeutig (van Ockenburg et al., 2019). Die Studien von Anmarkrud et al. 
(2013) sowie List und Du (2021) liefern erste empirisch Erkenntnisse zu diesen 
Zusammenhängen. Gemäß Anmarkrud et al. (2013) korreliert die Fähigkeit, 
relevante und nicht-relevante Inhalte korrekt zu erkennen, positiv mit der 
Textqualität. Auch List und Du (2021) berichten in ihrer Studie von (schwa- 
chen) positiven Korrelationen zwischen Textqualität und Auswahl- und Ver- 
knüpfungsprozessen. 

Die Frage, wie die drei Prozesse des Synthetisierens mit der Textqualität 
empirisch zusammenhängen und wie jeder der drei Prozesse für sich mit der 
Textqualität zusammenhängt, ist bislang nicht eindeutig geklärt. Diesen Zu- 
sammenhang untersuchen wir mit der sechsten Fragestellung. Sie lautet: Inwie- 
fern korreliert die Textqualität mit a) dem Anteil und der Korrektheit über- 
nommener Propositionen (Auswählen), b) dem Anteil und der Korrektheit der 
realisierten intertextuellen Verknüpfungen (Verknüpfen) und c) der Art der 
Textstrukturierung (Organisieren)? 
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3  Methodisches Vorgehen 


In unserer Untersuchung rekonstruieren wir aus Produktdaten die drei kogni- 
tiven Prozesse resp. deren Ergebnisse in den Texten. Wir analysieren, welchen 
Anteil an Propositionen Studierende aus Bezugstexten auswählen, wie sie ihre 
Diskurssynthesen strukturieren und welchen Anteil an möglichen Verknüp- 
fungen sie realisieren. 


3.1 Sample 


Gegenstand der Untersuchung sind für die Diskurssynthese relevante Lese- und 
Schreibleistungen von Lehramtsstudierenden im dritten Semester. 25 Studie- 
rende der Pädagogischen Hochschule Zürich haben zu zwei Zeitpunkten im 
Abstand von drei Monaten eine Diskurssynthese verfasst. Von den Studieren- 
den waren 21 (84%) weiblich und vier (16%) männlich. Zwei (8 %) Studieren- 
de streben das Lehramt für die Kindergartenstufe an, 19 (76 %) für die Primar- 
stufe und vier (16 %) für die Sekundarstufe 1. Alle Studierenden hatten mehrere 
Fächer in ihrem Studienprofil. 


3.2 Auftrag für die Studierenden 


Die Schreibaufgabe und die zwei Bezugstexte haben wir aus Escorcia et al. 
(2017) übernommen und auf Deutsch übersetzt. Die Studierenden haben die 
Schreibaufgabe zweimal im Abstand von drei Monaten (Oktober 2017 und 
Januar 2018) gelöst. Die Texte wurden am Computer auf einer Online-Lern- 
plattform verfasst. Dafür stand jeweils eine Stunde Zeit zur Verfügung. Der 
komplette Arbeitsauftrag nebst den nötigen beiden Bezugstexten ist in Kasten 1 
im Teilkapitel 2.1 dargestellt. 


3.3 Überblick über die abhängigen Variablen 


Zur Erfassung des Leistungsstands stützen wir uns auf produktbezogene Daten. 
Sämtliche Ratings wurden verblindet durchgeführt. Kein Rater wusste, welcher 
Text von welchem Messzeitpunkt und welcher Person stammte. Alle Rater 
haben vor dem Raten einen Schulungs- und Eichungsprozess durchlaufen. 
Tabelle 1 enthält die Instrumente, die wir entlang von Auswahl-, Verknüp- 
fungs- und Organisationsprozessen nach Spivey (1990) konzipiert haben. 
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Tabelle 1: Übersicht über die eingesetzten Instrumente bzw. der durchgeführten 


Analysen 


Analysefokus 


Instrument 


Rating 


a) Auswählen (Leseleis- 
tung) - Fragestel- 
lung 1: Anteil der 
Übernahme von 
Propositionen aus 
Bezugstexten 


— Rating: Anteil der Übernahme 
von Propositionen aus bei- 
den Bezugstexten gemäß 
Musterlösung 
(s. Abbildung 1) 

— 22 Variablen: 12 Variablen 
zu Bezugstext 1, 10 Variab- 
len zu Bezugstext 2 

— Ratings von Explizitheit und 
Korrektheit 


— 2 Personen (Erst- und Zweit- 
autor) 

— 4.400 Ratings 

— Übereinstimmungen: 87 % 
bei Bezugstext 1, 83 % bei 
Bezugstext 2 (Korrektur der 
Abweichungen durch Zweit- 
autor) 


b) Verknüpfen 
(Leseleistung) - Fra- 
gestellung 2: Anteil 
der intertextuellen 
Inferenzbildung 


— Rating: Anteil gebildeter 
Inferenzen aus dem inte- 
grierten mentalen Modell 
(IMM) (s. Abbildung 1) 

— 16 Variablen: 7 Variablen zu 
abstrahierten Propositionen 
aus beiden Bezugstexten 
und 9 Variablen zu Ver- 
knüpfungen zwischen den 
abstrahierten Propositionen 
im IMM und den thematisch 
entsprechenden Propositio- 
nen in den Bezugstexten 

— Rating nach Explizitheit und 
Korrektheit 


— 2 Personen (Erst- und Zweit- 
autor) 

— Total 3.200 Ratings 

— Übereinstimmung: 84 % 
(Korrektur der Abweichungen 
durch Zweitautor) 


c) Organisieren 
(Schreibleistung) - 
Fragestellung 3: 


— Rating nach Art der 
Textstrukturierung anhand 
eines Kategoriensystems 


— 2 studentische Rater 
— Total: 100 Ratings 
— Übereinstimmungen: 32 % 


Grad der Integration (s. Tabelle 2) perfekte Übereinstimmung, 
in der Textstruktur - 8 graduell unterschiedliche 42 % Differenz mit Unsicher- 
und Fragestellung 4: Strukturierungstypen heit eines Raters, 26 % ab- 
personenbezogene solute Differenzen (Korrektur 
Unterschiede t1 und der Differenzen durch dritten 
t2 Rater (Erstautor)) 

d) Korrelationen zwi- - Berechnung von 


schen Prozessen — 
Fragestellung 5: Zu- 
sammenhänge zwi- 
schen den drei Pro- 
zessmaßen 


Korrelationskoeffizienten 
(Pearsons r resp. Spearmans 
Rho) 


e) Textqualitat - Frage- 
stellung 6: Korrela- 
tion zwischen Text- 
qualitat und den drei 
Prozessmaßen 


- Holistisches Rating der 
Textqualität: Rangreihenfolge 
von 1 (min.) bis 10 (max.) 

— Berechnung von 
Korrelationskoeffizienten 
(Pearsons r resp. Spearmans 
Rho) 


— 2 studentische Rater 

— Total 100 Ratings (bei Abwei- 
chungen von Uber 2 Punkten 
drittes Rating durch dritten 
Rater in 8 Fallen) 
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3.3.1 Analytisches Rating von Leseleistungen zum Auswählen (Frage 1) 
und Verkntipfen (Frage 2) 


Zur Analyse von Auswahl- und Verknüpfungsprozessen haben wir ein Lese- 
modell erstellt (s. Abbildung 1). Das Modell bildet zu beiden Seiten in den gro- 
ßen Vierecken die propositionale Struktur der beiden Bezugstexte ab. Die Va- 
riablen 1-12 entsprechen den Propositionen des ersten Bezugstexts, die Variab- 
len 13-22 jenen des zweiten. Das mittlere Viereck stellt das integrierte mentale 
Modell (Perfetti et al., 1999) dar. Darin sind einerseits integrierte Propositionen 
enthalten, die sich aus den Propositionen der beiden Bezugstexte speisen. Eine 
integrierte Proposition ist eine Makroproposition, also eine inferenzbasierte 
Abstraktion respektive Generalisierung von thematisch gleichartigen Proposi- 
tionen aus beiden Bezugstexten. Das sind die Variablen 23-25, 29, 33, 34 und 
36. Andererseits enthält das IMM Verknüpfungen zwischen den abstrahierten 
Makropropositionen und den Propositionen der Bezugstexte. Das sind die 
Variablen 26-28, 30-32, 35, 37 und 38. Diese Verknüpfungen sind in der Ab- 
bildung 1 als gestrichelte Linien dargestellt. Das IMM beinhaltet insgesamt 16 
Variablen. 

Das Lesemodell berücksichtigt die ersten vier Hierarchieebenen der Be- 
zugstexte. Dieses Modell haben wir konsensuell erstellt, indem drei Personen, 
darunter Erst- und Zweitautor, die beiden Bezugstexte unabhängig voneinan- 
der lasen und eine Makrostruktur für jeden Bezugstext sowie für das IMM 
erstellten. Diese drei Musterlösungen wurden diskutiert und die entstehende 
Musterlösung aus Abbildung 1 abgeglichen und justiert. 

Der genaue Blick auf die Bezugstexte offenbart erhebliche Unterschiede zwi- 
schen den Texten, was deren Schwierigkeitsgrad betrifft. Während der zweite 
Bezugstext (s. Kasten 1, Text 2) auf der Textoberfläche explizite Hinweise auf 
Gliederung (z. B. „drei wichtige Funktionen“), Thematisierung (z. B. „Die erste 
Funktion - Bildung“) und Verknüpfung (z. B. „für dieses Ziel“) aufweist, zeich- 
net sich Text 1 gerade durch Abwesenheit expliziter Merkmale aus. Die makro- 
strukturelle Kohärenz wird in Text 1 vornehmlich durch semantische Bezüge 
hergestellt. Die Konstruktion einer (mentalen) Makrostruktur wirkt dadurch 
im Vergleich mit Text 2 anforderungsreicher. 

Das gesamte Modell besteht aus 38 Variablen und dient als Benchmarklö- 
sung zum Rating der studentischen Synthesen. Alle 38 Variablen wurden dop- 
pelt beurteilt, einerseits nach explizitem/implizitem Vorkommen und anderer- 
seits nach korrektem Vorhandensein. Zwei Rater (Erst- und Zweitautor) haben 
Texte aus dem Korpus, die nur für einen Messzeitpunkt vorlagen und nicht in 
die Studie einflossen, für Schulungszwecke genutzt. In mehreren Durchgängen 
wurden Texte zuerst individuell geratet, danach wurden Abweichungen ge- 
meinsam diskutiert. In diesem mehrstufigen Eichungsprozess wurde beurteilt, 
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Abbildung 1: Lesemodell mit propositionaler Struktur beider Bezugstexte und integrier- 


tem mentalem Modell als Musterlösung 
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welchen Anteil an Propositionen aus den Bezugstexten Studierende in ihren 
Texten übernehmen und welchen Anteil des IMM (Makropropositionen und 
Verknüpfungen von Propositionen) Studierende in ihren Texten integrieren. 
Die Übereinstimmung der Ratings betrug insgesamt 85 %. Beim ersten Be- 
zugstext betrug sie 87 %, beim zweiten Bezugstext 83% und beim integrierten 
mentalen Modell 84%. Alle Abweichungen wurden vom Zweitautor überprüft 
und nach Konsultation von beiden Raterurteilen final festgelegt. 


3.3.2  Analytisches Rating von Schreibleistungen zum Organisieren 
(Fragen 3 und 4) 


Die Analyse der Textstrukturierung haben wir auf Basis des Kategoriensystems 
von Segev-Miller (2007) vorgenommen. Die Kategorien bilden unterschiedliche 
Textstrukturmuster ab. Zwei studentische Rater wurden an zwei Halbtagen mit 
Synthesen, die nicht in die Untersuchung aufgenommen werden konnten, ge- 
schult und haben daraufhin alle Texte zu tl und t2 hinsichtlich der Struktur- 
muster beurteilt. Die acht Strukturmuster enthält Tabelle 2. 


Tabelle 2: Kategorien zur Analyse der Textstrukturmuster 


Kat.-Nr. | Bezeichnung Erläuterung 

0 Keine Bezugnahme | Es wird auf keinen der beiden Bezugstexte Bezug ge- 
nommen. 

1 Zusammenfassen Nur Inhalte eines Bezugstexts werden zusammenge- 

eines Texts fasst. 

2 Auflisten Inhalte beider Texte sind separat entlang der Bezugs- 
texte gebündelt und „en bloc“ nacheinander aufgeführt. 

3 Hybride Strukturie- | Texte weisen unterschiedliche Strukturmuster auf, je- 

rung ohne Integra- doch ohne Integration von Inhalten aus beiden Texten. 
tion 

4 Hybride Strukturie- Texten weisen unterschiedliche Strukturmuster auf, 

rung mit Integration | wobei mindestens ein Textteil eine integrierende Struktur 
aufweist. 

5 Ein-Text-Skelett Ein Bezugstext dient als Gerüst für den strukturellen 
Rahmen. Die Textstruktur folgt der Struktur eines Be- 
zugstexts. 

6 Strukturierung nach | Auftrennen und Neukombination von Inhalten beider 

Ideen Bezugstexte. Die Inhalte sind nach Ideen gebündelt. Die 
Verknüpfung der Inhalte und die Textstruktur insgesamt 
sind eher additiv. 

7 Synthese Eine eigene Struktur ist erkennbar. Die Verknüpfung der 
Inhalte ist eher vergleichend. Gemeinsamkeiten und 
Unterschiede der Positionen werden deutlich. 
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Die Kategorien sind graduell zu verstehen, wobei die Kategorie 0 von keiner 
Integrationsleistung zeugt und Kategorie 7 von sehr hoher Integrationsleistung 
und der Struktur einer Diskurssynthese entspricht. Die studentische Synthese 
(s. Kasten 2) entsprache der Kategorie Nr.5. Unser Kategoriensystem enthalt 
im Vergleich zur Kategorisierung von Segev-Miller (2007) zwei zusätzliche 
Kategorien, da sich nicht alle Texte eindeutig einer Kategorie zuweisen liefen. 
Manche Texte wiesen hybride Textstrukturierungen auf. Es kam vor, dass der 
erste Textteil nach dem Muster des Auflistens strukturiert war und der zweite 
eine Strukturierung nach Ideen aufwies. Deshalb fügten wir die zwei neue Kate- 
gorien Hybride ohne Integration (3) und Hybride mit Integration (4) hinzu. Die 
Rater stimmten in 32 % der Urteile perfekt überein, in 42 % aller Ratings mar- 
kierte einer der beiden Rater einen Zweifelsfall und in 26 % gab es unterschied- 
liche Urteile. Abweichungen wurden von einem dritten Rater (dem Erstautor) 
korrigiert. 

Zusätzlich zur Strukturmusteranalyse führten wir eine personenzentrierte 
Analyse durch. Wir haben untersucht, inwiefern sich die Art der Strukturierung 
personenbezogen zwischen beiden Messzeitpunkten unterscheidet. Dafür ha- 
ben wir die acht Kategorien auf zwei Kategoriengruppen reduziert, um zu un- 
terscheiden, ob eine Person die Textstruktur additiv und damit eher unange- 
messen oder integrativ und damit eher angemessen realisiert hat. Die Katego- 
rien 0-3 aggregierten wir zur Variable nicht-integrierenden Struktur. Die Kate- 
gorien 4-7 gruppierten wir zur Variable integrierende Struktur. Mit diesem 
Verfahren lässt sich feststellen, welche Personen zu welchem Messzeitpunkt 
eine integrierende respektive eine nicht-integrierende Struktur realisiert haben. 
Hierbei lassen sich vier Typen charakterisieren: 


e Konstant Integrierende: Personen realisieren zu beiden Messzeitpunkten 
eine integrierende Textstruktur. 

e Aufwärts-Integrierende: Personen realisieren zu tl keine integrierende 
Struktur, zu t2 aber schon. 

e Abwärts-Integrierende: Personen realisieren zu tl eine integrierende Struk- 
tur, zu t2 aber nicht. 

e Konstant Nichtintegrierende: Personen realisieren zu beiden Messzeitpunk- 
ten keine integrierende Struktur. 


Für jede dieser personenbezogenen Typen untersuchten wir außerdem, inwie- 
fern sie sich beim Auswählen und Verknüpfen von Inhalten unterschieden. Die 
Strukturmaße werden in einem Diagramm mit Auswahl- und Verknüpfungs- 
mafen in Zusammenhang gebracht (s. Abbildung 3 in Teilkapitel 4.2.2). 
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3.3.3 Holistische Analyse der Textqualitat 


Zwei Rater haben nach einer Schulung die studentischen Texte holistische be- 
urteilt, indem sie die Texte in eine Rangreihenfolge von 1 bis 10 brachten. Das 
Ratingverfahren haben wir aus Kirkpatrick und Klein (2009) übernommen. Je 
höher die zugewiesene Zahl, als desto besser wurden die Texte beurteilt. Die 
Rater kannten die Aufgabenstellung, die beiden Bezugstexte jedoch nicht. Die 
Interraterreliabilität betrug r = ‚81. Falls die Abweichung zwischen zwei Ratings 
mehr als zwei Punkte betrug, gab es ein drittes Rating. Das war bei 8 von 50 
Texten nötig. Bei zwei Ratings wurde der Mittelwert gebildet, bei drei der Me- 
dian verwendet. 


3.3.4 Korrelationsanalysen (Fragen 5 und 6) 


Wie in Teilkapitel 2.2.4 und 2.2.5 ausgeführt, berechnen wir Korrelationen 
zwischen Auswahl-, Verknüpfungs- und Organisationsmaßen, um zu eruieren, 
inwiefern diese Prozesse miteinander zusammenhängen. Zusätzlich führen wir 
Korrelationsanalysen zwischen der Schreibleistungen (Textqualität) und den 
prozessbezogenen Maßen des Auswählens, Verknüpfens und Organisierens 
durch. Je nach Skalenniveau verwenden wir unterschiedliche Korrelationskoef- 
fizienten. Für Korrelationen zwischen den intervallskalierten Daten (Maße des 
Auswählens, Verknüpfens und der Textqualität) verwenden wir Pearsons r, bei 
ordinalskalierten Daten (Organisationsmaße) Spearmans Rho. 


4 Ergebnisse 
4.1 Auswählen und Verknüpfen (Fragestellungen 1 und 2) 


Die Ergebnisse zu den ersten beiden Fragestellungen werden im Diagramm in 
Abbildung 2 zusammen dargestellt. Die erste Fragestellung lautete: Welchen 
Anteil an Propositionen übernehmen Studierende aus welcher hierarchischen 
Ebene der beiden Bezugstexte? Die zweite: Welchen Anteil an möglichen Infe- 
renzen aus Inhalten beider Bezugstexte realisieren Studierende in ihren Synthe- 
sen? Die Abbildung 2 zeigt die gesamthafte prozentuale Verteilung aller Va- 
riablen, die auf das Auswählen (Übernahme von Propositionen) und Verknüp- 
fen (Inferenzbildung) bezogen sind. Für alle Variablen A-I werden Ausprägun- 
gen an Explizitheit und Korrektheit mit separaten Balken im Diagramm ausge- 
wiesen. Die Variable A Gesamt ist eine aggregierte Variable, die alle Variablen 
des Auswählens und Verknüpfens - also B-I einschließt (s. Teilkapitel 3.3.1). 
Die Variablen, die das Auswählen betreffen, sind B (Text 1), C (Text 2) sowie 
E-H (Ebenen 1-4). Jene, die das Verknüpfen betreffen, sind D (IMM; inte- 
griertes mentales Modell) und I (Verknüpfungen). Die Variable I Verknüpfun- 
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gen weist ausschließlich textuelle Verbindungen zwischen dem IMM und Pro- 
positionen aus Bezugstexten aus. 


Abbildung 2: Verteilung der abhängigen Variablen im Auswählen und Verknüpfen im 
Gesamtsample 


Messzeitpunkt 1 (t1) Messzeitpunkt 2 (t2) 
(N=25) (N=25) 


Explizitheit — 
Korrektheit 
Explizitheit | 
Korrektheit | 13 
Explizitheit 
Korrektheit | 
Explizitheit | 
Korrektheit 
Explizitheit 
Korrektheit 
Explizitheit | 
Korrektheit | 
Explizitheit | 
Korrektheit | 
Explizitheit 
Korrektheit | 
Explizitheit | 
Korrektheit | 


A) 
Ge- 


IMM Text 2 |Text1 samt 


B) 


(0) 


D) 


E) 
1 


2 


F) 


H) 


6) 
fun- Ebene Ebene Ebene | Ebene 
3 


I) 
Ver- 
knüp- 
gen 


Grad an Explizitheit W explizit vorhanden Æ implizit vorhanden C nicht vorhanden 


Korrektheit E korrekt vorhanden O nicht korrekt vorhanden 


(Angaben in Prozent, Abweichungen von 100 Prozent basieren auf Rundungsfehlern; 
IMM = integriertes mentales Modell, Angaben zur Ebene 4 beziehen sich nur auf die Texte 1 und 2, 
Angaben zu den Verknüpfungen nur auf das IMM) 


4.1.1 Aggregierte Auswahl- und Verknüpfungsmaße: Variable A 


Die aggregierte Variable A Gesamt weist folgende Ausprägungen auf: Gesamt- 
haft ist der Anteil an übernommenen Propositionen und Inferenzbildung ge- 
ring (45 % und 44 %,). Die beiden Messzeitpunkte unterscheiden sich kaum 
in Bezug auf Übernahme und Inferenzen (Unterschied 0-6 % zwischen tl und 
t2 für alle Variablen). Der Anteil an expliziter und impliziter Übernahme und 
Inferenzbildung fällt für beide Messzeitpunkte ähnlich aus (tl: 25 %exp, und 
20 %impız t2: 22 %exp, und 22 %impi.). 

Auch der Anteil an korrekten Ubernahmen und korrekter Inferenzbildung 
ist fiir beide Messzeitpunkte gering, die Korrektheit nimmt zu t2 aber leicht zu 
(20 %u und 24 %,.2). Vergleicht man die Korrektheit der Variablen B-I einzeln, 
ist der Unterschied zwischen den Messzeitpunkte gering (Unterschied 0-12 % 
zwischen tl und t2). 
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4.1.2 Auswählen: Variablen B, C, E-H 


Die Betrachtung der auswahlbezogenen Variablen lasst folgende Muster erken- 
nen: Die Ubernahme von Propositionen aus beiden Bezugstexten ist unvoll- 
standig. Das zeigt der Durchschnitt aus den Variablen B Text 1 und C Text 2. 
Aus Variable C Text 2 wurde zu beiden Messzeitpunkten ein deutlich größerer 
Anteil an Propositionen übernommen als aus B Text 1 (Text 2: 67 % und 
63 %y; Text 1: 38 %u und 43%). Die Hierarchieebenen (Variablen E-I) unter- 
scheiden sich wenig, was Übernahmen betrifft (min. 43 % E2u; max. 54% E3u 
und min. 46 % E2 und F4u; max. 51 % E34). Tendenziell lassen sich mehr expli- 
zite Übernahmen aus Bezugstexten in höheren Hierarchieebenen und mehr 
implizite Übernahmen in tieferen Hierarchieebenen feststellen. 

Es gibt deutlich mehr korrekte Übernahmen aus C Text 2 als aus B Text 1 
(Text 2: 38 %u und 40 %p; Text 2: 13 % und 19 %u) sowie markant mehr kor- 
rekte Übernahmen aus höheren Hierarchieebenen als aus tieferen zu beiden 
Messzeitpunkten. 


4.1.3 Verknupfen: Variablen D (IMM) und I (Verknüpfungen) 


Die Verknüpfungsvariablen weisen folgende Spezifika auf: Bezogen auf die 
aggregierte Verknüpfungsvariable D IMM gibt es wenig Inferenzbildung über 
beide Bezugstexte zu beiden Messzeitpunkten (IMM: 32 %n; 33 %,.2). Ebenso ist 
der Anteil an Verknüpfungen (Variable I - Verbindungen zwischen inferierten 
Makropropositionen im IMM und Propositionen aus den Bezugstexten) tief 
(28 %u; 34 %n). Sowohl beim integrierten mentalen Modell (Variable D) als 
auch bei den Verknüpfungen I zeigt sich zu beiden Messzeitpunkten eine Ten- 
denz zu impliziter Inferenzbildung (ca. zwei Drittel sind implizit). Der Anteil 
an korrekten Inferenzen (Variable D) und korrekten Verknüpfungen (Variable 
I) ist zu beiden Messzeitpunkten klein (15 % und 15-18 %n). 


Exkurs: Korrelation zwischen Explizitheit und Korrektheit 


Um zu eruieren, inwiefern Explizitheit und Korrektheit statistisch zusammen- 
hängen, haben wir eine zusätzliche Analyse durchgeführt. Die Korrelations- 
analysen zwischen Explizitheits- und Korrektheitsmaßen ergab Folgendes: 
Explizites Vorhandensein korreliert signifikant mit korrektem Vorhandensein 
bei allen neun Variablen des Auswählens und Verknüpfens: r = ,67-,90 
(p < ‚001). Zwischen implizitem Vorhandensein und Korrektheit gibt es bei den 
beiden Variablen C Text 2 und E Ebene 1 signifikante negative Korrelationen: 
Cu: r = -,48 (p = 015) und Eu: r = -,55 (p = ‚004). Alle anderen Korrelationsana- 
lysen waren nicht signifikant. Demnach sind nur Explizitheit und Korrektheit 
stark miteinander assoziiert. 
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4.2 Organisieren (Fragestellungen 3 und 4) 


Die Ergebnisse zum Prozess des Organisierens beziehen sich auf die Fragestel- 
lungen 3 und 4. Zuerst wird die Verteilung der Strukturierungsmuster über 
beide Messzeitpunkte dargestellt. Im Anschluss daran werden Resultate zu 
personenzentrierten Strukturanalysen und die Zusammenhänge dieser Ergeb- 
nisse mit Auswahl- und Verknüpfungsvariablen präsentiert. 


4.2.1 Strukturierungsmuster 


Die Tabelle 3 enthält Ergebnisse zur dritten Fragestellung, die folgendermaßen 
lautete: Welcher Grad an Integration zeigt sich in der Textstruktur der studen- 
tischen Synthesen zu beiden Messzeitpunkten? Insgesamt realisieren zu t1 56 % 
der Studierenden eine integrierende Textstruktur (Kat. 4-7), 44 % eine nicht- 
integrierende Textstruktur (Kat. 0-3). Zu t2 beträgt das Verhältnis Integration 
zu Nicht-Integration 60 zu 40 %. Die beiden Messzeitpunkte unterscheiden sich 
in Bezug auf Strukturierungsleistungen in den zusammengefassten Kategorien 
damit nur geringfügig. Gleiches gilt für Unterschiede zwischen Messzeitpunk- 
ten innerhalb der einzelnen Kategorien. Es ist zu beiden Messzeitpunkten eine 
Dominanz der Strukturmuster Auflisten (2) und Hybride mit Integration (4) 
beobachtbar. 


Tabelle 3: Prozentuale Verteilung der Textstrukturierung nach Kategorien 


0) 1) 2) 3) 4) 5) 6) 7) 
Keine Zusam- Auf- Hybride Hybride Ein- Struktu- Syn- 
Bezug- men- listen A ohne mit Text- rierung these B 
nahme A fassen Integra- Integra- Ske- nach 
eines tion A tion B lett B Ideen B 
Texts A 
t1 8% - 32% 4% 24% 4% 16% 12% 
t2 - - 36% 4% 24% 12% 16% 8% 
Legende: A = später zusammengefasst zu nicht-integrierender Textstruktur; 


B = später zusammengefasst zu integrierender Textstruktur) 


4.2.2 Strukturtypen 


Die nachfolgenden Ergebnisse beziehen sich auf die vierte Fragestellung, die 
folgendermaßen lautete: Wie unterscheiden sich personenbezogen die Text- 
strukturen in Bezug auf Integration zu tl und t2? Generell verteilen sich die 
Studierenden auf die vier im Methodenteil (3.3.2) genannten Strukturtypen wie 
folgt (s. Abbildung 3): Von 25 Studierenden haben 8 konstant eine integrie- 
rende Struktur realisiert, 7 haben zu t2 die Struktur ihrer Texte verbessert, 6 
haben zu t2 die Textstruktur verschlechtert und 4 haben konstant eine nicht- 
integrierende Struktur realisiert. Der Anteil von Aufwärts- (28%) und Ab- 
wärts-Integrierenden (24 %) ist vergleichbar groß. 
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Abbildung 3: Verteilung der abhängigen Variablen im Auswählen und Verknüpfen 
in vier Gruppen zur Stabilität bei den Integrationsleistungen in einer 2-x-2-Gruppen- 


zugehörigkeit 
Konstant Aufwärts- Abwärts- Konstant 
Integrierende Integrierende Integrierende Nichtintegrierende 
(32%; N=8) (28%; N=7) (24%; N=6) (16%; N=4) 
Explizitheitt! EO 57 55 28 M9 53 24 (20 56 
E Explizitheitt2 EOI 58 2 Ha 61 29 Mor}! 
= 3 Korrektheit t1 | 22 78 ‚20 80 19 81 ‚2ı 79 
Korrektheitt2 23 77 27 73 21 79 26 74 
Explizitheitt! ETT] 65 64 55 66 
„5  Plizitheitt2 EN 6 56 51 50 
© Korrektheitt! 37 6 39 6a 3 a 5 55 
Korrektheitt2 37 63 38 62 35 65 56 44 
Explizitheitt B 34 29 EA o T 27 
of Explizitheitt? ETW] 40 34 WEM) v 58 23 19 
© Korrektheitt! | 37 6 39 a 3 a 4 55 
Korrektheit t2 37 63 38 62 35 65 56 44 
sS Explizitheitt) P 65 a 66 i 60 pa 66 
z 532 Explizitheittz MJ 64 60 76 73 
3 £ 3 Korrektheitti 18 82 13 87 17 83 3B 87 
— =Œ Korrektheitt2 16 84 29 71 10 90 1 89 
Explizitheitt! ET 54 38 MER] 16 50 
_ a Explizitheitt2 MEET] 50 KENNT 52 50 2 
= $ Korrektheitti 25 75 14 = u o 3 67 
Korrektheit t2 46 54 33 67 50 50 58 42 
Explizitheitt! EO 63 50 60 56 
_% Explizitheitt2 MET 58 50 69 37 
3 Korrektheitti "20 80 ‚a 33 ‚ 81 a 69 
Korrektheitt2 33 67 34 66 27 73 39 61 
Explizitheitt! [EGRET] 42 44 N) 4 57 
_ 2 Explizitheitt2 MIET] 56 s KENT 52 57 
© E Korrektheitti 32 6 4 79 2B 7 [23 77 
Korrektheitt2 22 78 32 68 23 77 20 80 
= Boitet EMEN 56 — 5s BEMA s DE 5 
=} z Explizitheitt2 MIO 64 49 Woo 57 39 2 
& & Korrektheitti 11 89 10 90 14 86 7 93 
~ Korrektheitt2 11 89 12 88 14 86 29 71 
S _ Explizitheitti FEIT) 74 80 69 6 58 
BEE Š Explizitheitt2 HE 60 64 70 72 
HE Korrektheitti 18 82 “m 89 15 85 17 83 
Š Korrektheitt2 17 83 ‚3 77 7 93 8 92 
Grad an Explizitheit u explizit vorhanden Æ implizit vorhanden O nicht vorhanden 
Korrektheit © korrekt vorhanden O nicht korrekt vorhanden 


(Angaben in Prozent, Abweichungen von 100 Prozent basieren auf Rundungsfehlern) 


In Abbildung 3 werden für jeden Strukturtyp Auswahl- und Verknüpfungs- 
maße aufgeführt, um zu eruieren, inwiefern sich die Strukturtypen hinsichtlich 
Auswahl- und Verknüpfungsprozessen unterscheiden. Damit wird Bezug ge- 
nommen auf einen Aspekt der fünften Fragestellung, welche die produktbezo- 
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genen Zusammenhänge zwischen Indikatoren des Auswählens und Verknüp- 
fens und des Organisierens fokussiert. 

Die Ergebnisse in Abbildung 3 verdeutlichen, dass sich die Strukturtypen 
global bei Auswahl- und Verknüpfungsmaßen nicht stark voneinander unter- 
scheiden. Sowohl bezüglich Explizitheit und auch bezüglich Korrektheit zeigt 
sich bei allen Variablen nur ein geringer Unterschied zwischen den Strukturty- 
pen für beide Messzeitpunkte. Auffällig ist, dass alle Strukturtypen zu beiden 
Messzeitpunkten mehr Propositionen aus Variable C Text 2 als aus Variable B 
Text 1 übernehmen. Der Anteil korrekter Übernahmen und korrekter Infe- 
renzbildung (Variable A Gesamt) ist bei allen Strukturtypen zu beiden Mess- 
zeitpunkten tief (20-27 %). Der Anteil an korrekten Inferenzen (Variable D 
IMM) und Verknüpfungen (Variable I) ist bei Aufwärts-Integrierenden zu t2 
höher als zu tl, nämlich mindestens doppelt so hoch (IMM: 13 %u und 29 %nġ; 
Verknüpfungen: 11 %u und 23%»). Die Gruppe der konstant Nichtintegrie- 
renden hat zu beiden Messzeitpunkten einen höheren Anteil korrekter Über- 
nahmen aus beiden Bezugstexten (Variablen B und C) als andere Strukturgrup- 
pen (45 %tı und 56 %n). 


4.3 Textqualitat (Fragestellung 6) 


Die Textqualität ist insbesondere für die Korrelationsanalysen relevant. Im 
Durchschnitt war die Textqualität zu tl (M = 6.06, SD = 1,87) tiefer als zu t2 (M 
= 6.32, SD = 1,63). Dieser Unterschied ist nicht signifikant, t(24) = -,56, p = ‚58. 


4.4  Korrelationsanalysen (Fragestellungen 5 und 6) 


Die fünfte Fragestellung lautete: Welche produktbezogenen Zusammenhänge 
bestehen zwischen den Indikatoren des Auswählens, Verknüpfens und Organi- 
sierens? Die Analyse anhand der Korrelationskoeffizienten - jeweils für beide 
Messzeitpunkte ausgewiesen - in Tabelle 4 brachte folgende Ergebnisse hervor: 
Insgesamt lassen sich keine klaren Korrelationsmuster zwischen den drei Indi- 
katoren feststellen. Es treten nur vereinzelt signifikante Korrelationen zwischen 
Variablen in Erscheinung. Ein systematischer Zusammenhang lässt sich jedoch 
nicht erkennen. 
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Tabelle 4: Ergebnisse zu Korrelationen zwischen Indikatoren des Auswahlens, Ver- 
knupfens und Organisierens sowie zwischen Textqualitat und den drei genannten 
Indikatoren 


t1 t2 t1 t2 t1 t2 t1 t2 

Text 1expr.+impt. Text Lexpı. Text Limp. Text 1korrektheit 
Text 2 ^ ,28*| ,39 D3** ‚>0* -,01 ,59**| ,27 ,50* 
IMM 4 ‚29 ‚39 ‚28 -12 ‚13 ‚Dark. 23 ‚03 
Struktur B ‚16 -,07 ‚00 -,27 ‚15 ‚18 ‚08 -,08 
Textqualitat © ‚40*| 29 ‚30 ‚24 ‚28 ‚18 ‚35 ‚25 

Text 2expi+impl. Text 2expi. Text 2mp. Text Qyorrektheit 
IMM 4 ‚40*| 32 ‚07 ‚08 ,43* | ‚29 ‚22 ‚15 
Struktur ® -,25 -,15 -,13 -,14 -,15 ‚18 -,31 -,08 
Textqualitat © ‚25 ‚34 ‚46* ‚06 -44*| ‚42 ‚28 ‚14 

IMMexp1.simpl IMM exoı. IMM impi. IMM korrektheit 
Struktur ® ‚01 sO2F* |) 29) ‚36 -,19 33 „21 ‚25 
Textqualität © ,49* | ,51**| ,51** ‚35 ‚19 ‚25 Ltt ‚22 

A= Gleiche Variable wie in der Horizontale, nur bezogen auf jeweils anderen Gesamtscore aus dem 


Lesemodell, Pearsons r 
B= Bezogen auf prozentuale Verteilung nach Kategorien (s. Tabelle 3), Spearmans Rho 
C= Pearsonsr 
(* p < ,05; ** p < ,01) 


Auffallig ist besonders die Abwesenheit von Korrelationen zwischen Struktur- 
und Auswahlmaßen. Das Organisieren scheint mit anderen Prozessen kaum 
verbunden zu sein, da die Strukturmaße von insgesamt 32 Analysen nur an 
einer einzigen Stelle signifikant mit einer anderen Variable korrelieren (IM- 
Mexpl.+impi. ZU t2). Ein zweiter auffälliger Punkt aus den Korrelationsanalysen ist, 
dass Auswahlprozesse zwischen Text 1 und Text 2 zusammenhängen, vor allem 
zum zweiten Messzeitpunkt: Je expliziter und korrekter Propositionen aus dem 
einem Bezugstext ausgewählt werden, desto expliziter und korrekter werden sie 
auch aus dem zweiten Bezugstext ausgewählt. 

Die sechste Fragestellung lautete: Inwiefern korreliert die Textqualität mit a) 
dem Anteil und der Korrektheit übernommener Propositionen (Auswählen), b) 
dem Anteil und der Korrektheit der realisierten intertextuellen Verknüpfungen 
(Verknüpfen) und c) der Art der Textstrukturierung (Organisieren)? Insgesamt 
ergibt sich, dass die Textqualität allein mit den Verknüpfungsmaßen aus dem 
integrierten mentalen Modell in mittlerem Maß korreliert. Dieser Effekt zeigt 
sich auf der Ebene der aggregierten Verknüpfungen (IMMexp1.+imp1) für beide 
Messzeitpunkte und zusätzlich bei explizit übernommenen Verknüpfungen aus 
Text 1. Ebenfalls zeigt sich eine mittlere Korrelation zwischen Textqualität und 
der Korrektheit der Verknüpfungen. Indikatoren der Auswahlprozesse hängen 
hingegen nicht systematisch mit der Textqualität zusammen. Zwischen den 
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Variablen Strukturierung und Textqualitat gibt es zu beiden Messzeitpunkten 
keine signifikante Korrelation: r = ,19 (p = ,38) zu t1 bzw. ,21 (p = ,32) zu t2. 


5 Diskussion 


Unsere Studie hatte zum Ziel, die kognitiven Prozesse des Auswählens, Organi- 
sierens und Verknüpfens, die beim Verfassen von Diskurssynthesen beteiligt 
sind, produktbezogen mit diversen geschulten Ratern zu rekonstruieren. Wir 
haben aufgrund von Schreibleistungen von Studierenden Rückschlüsse auf 
Prozesse gezogen. Dieser Ansatz ist natürlich methodisch kritisierbar, weil 
Produkte und Prozesse nicht dasselbe sind, wir also nur begrenzt valide Aus- 
künfte über faktisch abgelaufene Prozesse geben können. Wir haben also deren 
rekonstruierbare Spuren fokussiert. 

Drei Erkenntnisinteressen standen dabei im Vordergrund. Das erste betraf 
die Leistungen von Studierenden (Fragestellungen 1-4). Wir haben anhand 
einer Musterlösung genau kartiert, welche Auswahl-, Verknüpfungs- und Or- 
ganisationsleistungen erbracht werden können, und haben die studentischen 
Diskursynthesen daran gemessen. Ein zweiter Interessenfokus lag auf den 
Zusammenhängen zwischen den drei Prozessen (Fragestellung 5). Wir eruier- 
ten, inwiefern die drei Leistungsmaße (und damit auch die drei Prozesse) mit- 
einander zusammenhängen. Das dritte Forschungsinteresse bestand darin, zu 
erheben, welches der Leistungsmaße wie stark mit der Textqualität korreliert 
(Fragestellung 6). Die folgenden Ausführungen sind entlang dieser drei Er- 
kenntnisinteressen strukturiert. 


5.1 Fokus 1: Auswahl-, Verknüpfungs- und Organisationsleistungen 


Die vorliegende Untersuchung brachte generische Schwierigkeiten von Studie- 
renden bei allen drei Prozessen hervor. Besonders deutlich offenbarten sich die 
Schwierigkeiten bei Verknüpfungs- und Organisationsleistungen, jenen Prozes- 
sen also, die Inferenzleistungen erfordern. Diese lagen in unserer Studie auf 
niedrigem Niveau. Die Studierenden realisierten nur ca. ein Drittel aller mögli- 
chen Verknüpfungen. Das Produzieren einer integrativen Textstruktur gelang 
zwei Fünftel der Studierenden nicht. Diese Probleme zeigten sich zu beiden 
Messzeitpunkten in vergleichbarem Ausmaß. Es war keine Verbesserung der 
Leistungen aufgrund des Durchlaufens eines Studiensemesters auszumachen. 
Die Befunde decken sich mit anderen Studien, in denen Inferenzprozesse un- 
tersucht und als Schwierigkeit benannt wurden (Barzilai & Eshet-Alkalai, 2015; 
Braasch et al., 2013; Gil et al., 2010; List & Du, 2021; Mateos & Solé, 2009; Pri- 
mor & Katzir, 2018; Segev-Miller, 2007; Wiley & Voss, 1999). 
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Das Auftreten von Schwierigkeiten beim Inferieren in unserer Studie war 
demnach erwartbar, daher haben wir genauer geprüft, worin sich die schwie- 
rigkeitsgenerierenden Merkmale zeigten, nämlich bei einem bislang blinden 
Fleck in der Forschung zur multiplen Textintegration: den Bezugstexten. Aus 
der Leseforschung zu Einzeltexten ist bekannt, dass kohärente Texte mit sa- 
lienter Struktur leichter mental repräsentiert werden können und weniger kog- 
nitive Ressourcen fürs Verstehen beanspruchen (Kintsch, 1990; McNamara et 
al., 1996). Die von uns verwendeten Bezugstexte unterscheiden sich stark hin- 
sichtlich des Schwierigkeitsgrads (s. Teilkapitel 3.3.1). Der erste Text weist im 
Gegensatz zum zweiten eine implizite Makro- und Mikrostruktur auf und ist 
damit insgesamt anspruchsvoller. Diese textseitigen Faktoren schlugen sich in 
den Auswahl- und Verknüpfungsleistungen nieder: Die Studierenden haben 
aus dem schwierigeren Text markant weniger Propositionen ausgewählt und 
integriert. Paradoxerweise zeigen Untersuchungen aus der Leseforschung aber, 
dass solche anforderungsreichen Texte größeres Potenzial fürs Lernen mit und 
durch Texte beinhalten (Kintsch, 1990; McNamara et al., 1996), vermutlich weil 
die Implizitheit Leserinnen und Leser zu intensiveren Verarbeitungs- und Infe- 
renzleistungen drängt (Primor & Katzir, 2018). Personen mit hoher Lesekom- 
petenz und viel Vorwissen füllen inkohärente Stellen und fehlende Informatio- 
nen unter Zuhilfenahme des Vorwissens auf und generieren so Verknüpfungen. 
Die Textinhalte werden dadurch aktiver verarbeitet und sind dem Verständnis 
zuträglicher (Kintsch, 1990; McNamara et al., 1996). Für das Schreiben von 
Diskurssynthesen ist aber weithin ungeklärt, wie der Schwierigkeitsgrad der 
Bezugstexte das Integrieren von Texten und somit das Lernen via multiple 
Textintegration beeinflusst. Untersuchungen zum Verhältnis von Textschwie- 
rigkeit und Verstehensleistungen über mehrere Texte stellen ein dringendes 
Desiderat dar. 


5.2 Fokus 2: Zusammenhänge zwischen Auswahl-, Verknüpfungs- 
und Organisationsleistungen 


Der zentrale Befund lautet, dass produktbezogene Auswahl-, Verknüpfungs- 
und Organisationsmaße in dieser Studie nicht miteinander korrelieren. Es 
scheint im Gegenteil so zu sein, dass das Auswählen, Verknüpfen und Organi- 
sieren - zumindest aus einer Produktperspektive - relativ unabhängig vonein- 
ander in Erscheinung treten. Auch den vier Strukturierungstypen, die wir im 
Längsschnitt erfasst haben, zeigen sich keine musterhaften Zusammenhänge 
zwischen den drei Maßen. Dieser Befund liegt quer zur Theorie (s. Teilkapitel 
2.2.4), denn die drei Prozesse scheinen eng miteinander verbunden: Das Ver- 
knüpfen bedingt das Auswählen von Propositionen. Ein integriertes mentales 
Modell setzt das Verstehen der einzelnen Texte voraus. Auch das Organisieren 
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ist an Prozesse des Auswählens und Verknüpfens von Inhalten gebunden (Spi- 
vey, 1990; van Ockenburg et al., 2019). 

Nimmt man andere empirische Studien in den Blick, die strukturanalog zu 
unserer Untersuchung Korrelationen zwischen Auswahl-, Verknüpfungs- und 
Organisationsvariablen ausgewiesen haben, zeigen sich teils Zusammenhänge. 
List und Du (2021) berichten eine Korrelation zwischen einer Auswahl- und 
einer Verknüpfungsvariable. Auch Barzilai und Eshet-Alkalai (2015) fanden 
eine Korrelation zwischen einer Variable zum Auswählen (Verstehen wichtiger 
Propositionen) und Inferenzleistungen. Die Korrelationen in diesen beiden 
Studien treten jedoch vereinzelt auf, eine Systematik ist nicht erkennbar. An- 
dere Studien lassen keine Rückschlüsse auf Korrelationen zu (Anmarkrud et al., 
2013; Escorcia et al., 2017). Insgesamt ergibt sich aus empirischer Sicht kein 
einheitliches Bild zu diesen Zusammenhängen (Philipp, 2018). Weitere For- 
schung zum Verhältnis und zum Zusammenhang zwischen den drei Prozessen 
ist also nötig und wünschenswert. 


5.3 Fokus 3: Zusammenhänge zwischen Textqualität und Auswahl-, 
Verknüpfungs- und Organisationsleistungen 


Die Textqualität wurde in unserer Untersuchung holistisch erfasst. Den Ratern 
waren die Rahmenbedingungen und die Aufgabenstellung bekannt, die Be- 
zugstexte jedoch nicht. In den Korrelationsanalysen trat das Verknüpfen als 
einziger Indikator für Textqualität musterhaft hervor. Die Auswahl- und Orga- 
nisationsmaße korrelierten nicht mit der Textqualität. Die Korrelation zwi- 
schen Verknüpfungsleistungen und der Textqualität deckt sich mit Resultaten 
anderer Studien, bei denen aber teils auch Auswahl- und Organisationsleistun- 
gen mit Textqualität zusammenhingen (Ackerman, 1991; Anmarkrud et al., 
2013; List & Du, 2021; Mateos & Sole, 2009; Spivey & King, 1989). Inferenz- 
leistungen scheinen für die Textqualität von Diskurssynthesen also hochgradig 
relevant. Das zeigt sich deutlich auch bei Spivey (1991). Dort war die Fähigkeit, 
Inhalte aus zwei Texten zu verknüpfen und diese als Makropropositionen im 
Text zu präsentieren, der stärkste Prädiktor für die holistisch beurteilte Text- 
qualität. Mit dem Verknüpfen scheint der Prozess des Strukturierens eng ver- 
wandt und auch relevant für die Textqualität zu sein, da beide Prozesse dazu 
führen, dass aus der Lektüre der Bezugstexte ein kohärenter Text resultiert. In 
unserer Untersuchung fanden wir aber keine Korrelationsmuster zwischen 
Organisationsmaßen und Textqualität, obwohl ein Zusammenhang theoretisch 
nahe liegt. Bislang existieren wenig Untersuchungen zum Zusammenwirken 
von Strukturierungsprozessen und Textqualität beim Schreiben über mehrere 
Texte. Es bedarf diesbezüglich weiterführender Forschung. Wie oben erwähnt, 
hatte auch ein hoher Anteil ausgewählter Inhalte aus Bezugstexten keinen Ein- 
fluss auf die Textqualität. Spivey (1991) zeigte in ihrer Studie, dass sich ein 


124 


hoher Anteil übernommener Propositionen im Gegenteil sogar negativ auf die 
Textqualität auswirkte. Das losgelöste Wiedergeben von Inhalten aus Bezugs- 
texten allein gereicht nicht zu einer guten Synthese. Es bedarf dafür eines akti- 
ven Stiftens von Kohärenz, indem Inhalte durch Inferenzbildung und Ver- 
knüpfung mit Vorwissen miteinander in Beziehung gebracht werden. 


5.4 Abschlussbemerkung 


Alles in allem lohnt sich (nicht nur) im Licht der Befunde unserer Studie ein 
genauer Blick in der Leseforschung darauf, welche textseitigen Faktoren sich 
auf die kognitiven Prozesse des Lesens und Schreibens auswirken. Wir denken, 
dass insbesondere die Eigenheiten der eingesetzten Texte und Textsorten hin- 
sichtlich ihrer schwierigkeitsgenierenden Merkmale jenseits von Lesbarkeitsin- 
dizes und Umfangsmaßen mehr Beachtung verdienen. So ließe sich auch ein- 
holen, was beispielsweise Modelle wie das MD-TRACE-Modell (Rouet & Britt, 
2011) postulieren: ein kontextsensitives Vorgehen. Dies in Verbindung mit den 
individuumsbezogenen Merkmalen (Barzilai & Strømsø, 2018) multimetho- 
disch in puncto Prozess- (Mason & Florit, 2018) und Produktdaten herauszu- 
arbeiten (Primor & Katzir, 2018), ist ein dringend zu bestellendes Feld der 
Schreib- und Leseforschung. 
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Ist argumentatives materialgestutztes 
Schreiben dem informierenden überlegen? 


Eine Sekundäranalyse experimenteller Studien 
zu den Effekten der Zieltextsorte 
auf Verstehensleistungen 


Maik Philipp 


Zusammenfassung: Dem materialgestützten Schreiben (MGS) wird ein hohes episte- 
misches Potenzial für das tiefe Verstehen von multiplen Dokumenten zugestanden. 
Dabei scheinen strategische Prozesse der Informationstransformation den Ausschlag 
zu geben, welche ihrerseits von der Zieltextsorte des MGS abhängen. Dieser Beitrag 
widmet sich der empirischen Frage, inwieweit differenzielle Effekte bei Paarvergleichen 
in 18 experimentellen Studien tatsächlich festgestellt wurden. Mittels Vote-Countings 
wurden für drei besonders häufig untersuchte Zieltextsorten — Argumentation, Be- 
schreibung und Zusammenfassung — und mit einem theoriebasierten Kodierraster 
jeweils für sechs Gruppen von abhängigen Variablen in expressiven und rezeptiven 
Tests Effekte zusammengefasst. Dabei zeigte sich keine durchgängige Überlegenheit 
einer Zieltextsorte, dafür aber Muster in Form relativer Überlegenheiten in einzelnen 
Gruppen von Variablen. Hinzu kamen Effekte des intertextuellen Verhältnisses der 
Dokumente, über die die Testpersonen schrieben. 


Schlüsselwörter: materialgestütztes Schreiben, Leseverstehen, Deep Reading, Lese- 
strategien, Textsorte 


Abstract: Writing-from-sources (WFS) is regarded as a cognitively demanding, yet fruit- 
ful activity when it comes to learning from multiple documents. Transformational pro- 
cesses seem to be the key activities of comprehension and they depend on the text 
genre of WFS. This chapter summarizes the empirical evidence of studies that used 
statistical pair comparisons from 18 experiments to shed light on differential outcomes 
of different genres used in WFS. By means of vote-counting procedures comprehensive 
codings and analyses were conducted for the three most studied genres (argumen- 
tation, narration/description and summary). Theoretically derived codes were used for 
3 groups of outcomes and 3 groups of processes as well for expressive or receptive 
outcomes and for intertextually complementary or conflicting documents. Results indi- 
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cate no clear-cut superiority of any of the three genres, but there emerge patterns 
depending on intertextual relationships and kind of tasks in each genre. 


Keywords: writing-from-sources, discourse synthesis, deep reading comprehension, 
reading strategies, genre 


1 Einleitung 


Wer heute liest, tut dies zunehmend digital und auf der Basis verschiedener 
multimodaler Dokumente. Gerade strittige oder ambige Themen - von politi- 
schen Fragen bis hin zu (natur-)wissenschaftlichen Kontroversen - sind von 
einer Vielstimmigkeit im Diskurs und zunehmend auch von gezielten Desin- 
formationen (Fake News) gekennzeichnet, die von Leserinnen und Lesern eini- 
ges abverlangen, wenn sie kritisch partizipieren und sich informieren wollen. 
Hinzu kommt, dass Aufgabenformate wie das «materialgestützte Schreiben» 
sich dessen bedienen und zusätzlich zur erfolgreichen Rezeption auch die glü- 
ckende Produktion von Texten einfordern. Als ein authentisches Beispiel hier- 
für kann der folgende Schreibauftrag aus Tabelle 1 gelten, den Studierende 
mithilfe von fünf digitalen Dokumenten bearbeiteten, die sich teils widerspra- 
chen, teils ergänzten. 


Tabelle 1: Zwei Varianten eines Auftrags des materialgestützten Schreibens, Variante 1 
mit der Zieltextsorte Zusammenfassung, Variante 2 mit der Zieltextsorte Argumenta- 
tion 


Auftrag Variante 1: Stellen Sie sich vor, Sie Auftrag Variante 2: Stellen Sie sich vor, Sie 
müssen anderen Studierenden einen kurzen | müssen anderen Studierenden einen 
Bericht schreiben, in dem die Ursachen des kurzen Bericht schreiben, in dem Sie Ihre 
Klimawandels zusammengefasst sind. persönliche Meinung zu den Ursachen des 
Klimawandels äußern und begründen. 


Stützen Sie Ihren Bericht auf Informationen, die in den folgenden fünf Texten enthalten 
sind. Sie finden Informationen, die für das Schreiben Ihres Berichts relevant sind, und 
Informationen, die für das Schreiben des Berichts nicht relevant sind. Verwenden Sie die 
relevantesten Informationen und versuchen Sie, sich klar auszudrücken und die Informa- 
tionen auszuarbeiten — vorzugsweise in Ihren eigenen Worten. 


Quelle: Übersetzung von Gil et al., 2010a, S. 163; der untere Teil des Arbeitsauftrags galt für beide 
Varianten) 


Wenn Leserinnen und Leser solche Aufträge erfolgreich bearbeiten wollen, 
müssen sie diverse lese- und schreibstrategische Handlungen absolvieren, um 
dem geforderten Produkt zu entsprechen. Die Frage ist, ob hierbei verschiedene 
Schreibaufträge mit divergierenden Zieltextsorten empirisch differenzielle Er- 
gebnisse nach sich ziehen. Lesedidaktisch ist das deshalb eine wichtige Frage, 
weil die Aufgabenstellungen selbst schon als eine Intervention betrachtet wer- 
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den können - und sie gelten im Vergleich zu logistisch aufwändigeren Förder- 
maßnahmen wie der Vermittlung von Strategien als niederschwelliger und 
leichter implementierbar (Stadtler, Bromme & Rouet, 2018). Hinzu kommt, 
dass bereits metaanalytisch belegt ist, dass generell verschiedene Schreibför- 
dermaßnahmen mit variierenden Zieltextsorten differenzielle Wirkungen auf 
das Verstehen von einzelnen Sachtexten haben (Graham & Hebert, 2011). Für 
das materialgestützte Schreiben ist das bislang nur wenig ausgeschildert (Phi- 
lipp, 2020) und gilt dennoch als aussichtsreicher Weg (Rouet, Britt & Potocki, 
2019). 

An diesem Punkt setzt der Beitrag an. Er widmet sich der empirischen 
Frage, ob die Variation der Zieltextsorte - so wie im Beispiel der zwei Varianten 
von Schreibaufträgen aus Tabelle 1 - sich in Tests statistisch signifikant nieder- 
schlägt, also ob es spezifische Vor- oder Nachteile gibt. Die Basis hierfür ist eine 
kriterienbasierte Sichtung von experimentellen Studien, in denen gezielt die 
Zieltextsorte - und zwar nur die Zieltextsorte - zwischen Teilnehmenden vari- 
iert wurde. Diese Studienbefunde systematisch nach einem feiner differenzier- 
ten Auswertungsschema auszuwerten und zu quantifizieren, ist damit Ziel des 
Beitrags. 


2 Materialgestitztes Schreiben - ein Hybrid strategischer Lese- 
und Schreibprozesse 


Das materialgestützte Schreiben - international auch als «Writing from Sour- 
ces» oder «Discourse Synthesis» deklariert - bezeichnet das Schreiben eines 
eigenen (Sach-)Textes auf der Basis mehrerer gelesener Dokumente in Hinblick 
auf einen mehr oder minder expliziten Auftrag hin (Philipp, 2017). Entschei- 
dend ist hierbei, dass kein einzelner Text, sondern mehrere (durchaus multi- 
modale) Texte nebst zugehörigen Metadaten als zusätzlich bedeutungstragende 
Informationseinheiten von der lesenden Person zu verstehen und in Hinblick 
auf ein gefordertes schriftliches Aufgabenprodukt zu verarbeiten sind. Dabei 
sind diverse strategische Lese- und Schreibprozesse nötig, die im Folgenden 
entfaltet werden. Zunächst geht es um tiefe Verstehensleistungen im rezeptiven 
Teil des materialgestützten Schreibens (2.1), während schreibnahe (Planungs- 
und Transformations-)Prozesse in ihrem Verbund danach beleuchtet werden 
(2.2). 
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2.1 Leseverstehen multipler Dokumente und das Konzept 
«Deep Reading» 


2.1.1 Deep Reading und einzelne Texte 


Das verstehende Lesen wird in der Kognitionspsychologie als Prozessverbund 
modelliert, bei dem automatisiert ablaufende sowie direkt steuerbare Prozesse 
interagieren. Das produktbezogene Ergebnis dieser Prozesse sind verschiedene 
Formen der kognitiven Repräsentation. Dabei werden gemäß dem einflussrei- 
chen «Construction-Integration-Modell» drei Varianten des Leseverstehens 
unterschieden: a) die wortwörtliche Repräsentation, b) die propositionale Re- 
präsentation (verstanden als vorwissensbasierte Verknüpfung von sprachlichen 
Hauptinhalten und ihren Verbindungen untereinander) sowie c) das mentale 
Modell als nicht-sprachliche, umfassende Repräsentation von Textinhalten 
(Richter & Schnotz, 2018). Für das Erlangen eines mentalen Modells müssen 
lesende Personen diverse kognitive Reduktions- und Anreicherungsprozesse 
bei den Inhalten erfolgreich absolviert haben, während diese bei der wortwört- 
lichen Repräsentation nicht nötig sind. Prototypisch lässt sich an diesen beiden 
Repräsentationsarten das Kontinuum von oberflächlicher und Tiefenverarbei- 
tung, von «Shallow Reading» und «Deep Reading» aufspannen, da die wort- 
wörtliche Repräsentation kein zwingendes Verstehen des Inhalts voraussetzt, 
das mentale Modell hingegen sehr deutlich. 

Das tiefe oder oberflächliche Verstehen von Textinhalten wird meist als 
Oppositionspaar dargestellt. Ein Beispiel dafür stammt von Graesser, Leon und 
Otero (2002, S. 6), die die gelesenen Inhalte von (wissenschaftlichen) Texten als 
oberflächliches bzw. tiefes Wissen kontrastieren: 


«Oberflächliches Wissen besteht aus explizit genannten Inhalten in Texten, die sich 
beziehen auf Listen von Konzepten, eine Handvoll einfacher Fakten oder Merkmale 
jedes Konzepts, einfache Definitionen von Hauptbegriffen und Hauptschritte bei 
Prozeduren (nicht detaillierten Schritten). Tiefes Wissen besteht aus kohärenten 
Erklärungen des Inhaltes, welche die lesende Person ermutigen, Inferenzen zu bil- 
den, Probleme zu lösen, Entscheidungen zu treffen, neue Ideen zu synthetisieren, 
Inhalte in Teile zu zerlegen, zukünftige Ereignisse in einem System zu prognostizie- 
ren und Wissen in praktischen Situationen anzuwenden.» 


Nach dieser Gegenüberstellung zeichnet sich tiefes Leseverstehen vor allem 
dadurch aus, dass die lesende Person auf der Basis gelesener Textinhalte und 
der Anwendung von eigenen Wissensbeständen Schlussfolgerungen zieht, um 
das Gelesene für variable Zwecke anzuwenden. Dies deckt sich mit dem Katalog 
der sieben Merkmale tiefen Lesens, den O’Reilly, Sabatini und Wang (2018) mit 
Blick auf eine sogenannte szenariobasierte Variante des Messens von tiefem 
Leseverstehen benennen, um dadurch das Konzept «Deep Reading» abzuste- 
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cken (s. Kasten «Tiefes Leseverstehen»). Insbesondere sind die Merkmale 2, 3 
und 7 deutlich anschlussfahig an die obige Definition. Der Merkmalskatalog 
geht allerdings noch darüber hinaus, weil es um den kritischen Umgang mit 
Informationen und Informationsquellen (Merkmal 5) und um die Partizipation 
an Diskursen und ihren Regeln (Merkmal 6) geht. Alle diese Merkmale - zumal 
das erste mit dem Zweck des Lesens - sind insbesondere für das Lesen multip- 
ler Dokumente im Allgemeinen (2.1.2) und das materialgestützte Schreiben im 
Besonderen (2.2) von eminenter Bedeutung. 


Tiefes Leseverstehen ... 


1) 
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... wird zumindest teilweise vom Zweck und dem Ziel des Lesens bestimmt. Leserinnen 
und Leser adaptieren je nach Aufgabenanforderungen einen sogenannten «Kohärenz- 
standard», sie definieren also ein Soll an Leseverstehen, welches ihre Aufmerksamkeit 
und ihren lesestrategischen Umgang lenkt. Je komplexer die lesebezogene Aufgabe 
ist, desto wahrscheinlicher ist es, dass ein tieferes Leseverstehen angestrebt und er- 
reicht wird. 

... beinhaltet, über das wortwörtliche Verstehen gegebener Inhalte hinauszugehen, 
indem die lesende Person gezwungen wird, implizite Inhalte zu erschließen. Texte er- 
fordern es, entfernt voneinander liegende Informationen kohärent aufeinander zu be- 
ziehen sowie implizite Informationen mit Vorwissen anzureichern. Das Bilden von Infe- 
renzen ist dazu nötig, sich die (durchaus implizite) Bedeutung von Texten durch aktives 
schlussfolgerndes Denken zu erschließen. 

... bedeutet, mehr als nur die Hauptinhalte oder -fakten zu wissen, sondern die Verbin- 
dung zwischen ihnen. Dieses Merkmal hängt mit der Nr. 2 zusammen: Texte sind keine 
isolierte Sammlung von Informationen, sondern bedürfen der aktiven kognitiven Inte- 
gration und Restrukturierung, um eine kohärente Repräsentation zu erzielen. Erst sol- 
che kognitiven Verknüpfungen der lesenden Person gelten als hinreichend für komple- 
xeres Verstehen. 

. inkludiert die Fähigkeit, bedeutungsvolle Fragen zu formulieren, die das eigene 
Verstehen herausfordern oder über die Aussagen der Autorin/des Autors hinausgehen 
und diese infrage stellen. Mit diesem Merkmal ist gemeint, dass Leserinnen und Leser 
im Falle des tieferen Leseverstehens sowohl ein mentales Zwiegespräch mit dem Text 
führen, um ihr sich entwickelndes und veränderndes Erkenntnisinteresse entlang des 
Textes zu verbalisieren, als auch ein metakognitives Befragen ihrer selbst vornehmen, 
um die Auseinandersetzung mit dem Textinhalt zu gewährleisten. 

... beinhaltet die Fähigkeit, die Autorinnen und Autoren sowie ihre Aussagen und ihre 
Belege zu evaluieren. Leseverstehen bedeutet mehr als die (Re-)Konstruktion eines 
Textinhaltes. Zunehmend geht es darum, den Wahrheitsgehalt von Aussagen, die Qua- 
litäten von Texten und die Absichten und Qualifikationen von Autorinnen und Autoren 
kritisch im Blick zu behalten. Dieses evaluative Moment dient als kognitiv anspruchs- 
volle und voraussetzungsreiche Sicherungsmaßnahme dazu, epistemische Urteile für 
und gegen die Aufnahme von Informationen, Perspektiven oder ganzen Texten zu fäl- 
len. Gleichzeitig ist ein solch kritisches Lesen essenziell im versierten Umgang mit digi- 
talen Internet-Texten. 

... Ist zwar ein Merkmal mit individuellen Ursprüngen, ist allerdings auch sozial inso- 
fern, als es an den Maßstäben von Fachdisziplinen gemessen wird und sich in sozialen 
Diskursen vollzieht. Lesen wird als kommunikativer Akt innerhalb sozialer Kontexte 
modelliert. Das bedeutet für das tiefe Leseverstehen, dass Texte in ihrem Kontext zu 
sehen - und zu verstehen - sind. Für das angemessene Verstehen müssen daher le- 
sende Personen Wissensbestände aus jenen Kontexten berücksichtigen, in denen die 
Kommunikation stattfindet. Das gilt insbesondere für die Teilhabe an disziplinären 


Diskursen, bei denen der Umgang mit Divergenz und Vorlaufigkeit, mit Uber viele ein- 
zelne Dokumente verteilten Konstituenten geteilten Wissens und mit unterschiedli- 
chen Perspektiven typisch ist. 

7) ... manifestiert sich im Anwendungsbezug in variablen Situationen. Lesen dient häufig 
instrumentellen Zwecken, d.h. die Nutzung der Informationen aus und über Texte 
stellt oftmals das Motiv dar, etwas zu lesen. In der adäquaten variablen Anwendung 
der Textinhalte manifestiert sich ein wünschenswert tiefes Verstehen. (Quelle: Dar- 
stellung gemäß O’Reilly et al., 2018, S. 198-202) 


2.1.2 Deep Reading und multiple Dokumente 


Die bisherigen Ausführungen konzentrierten sich auf das Verstehen singulärer, 
also einzelner (Sach-)Texte und das Konzept des Deep Reading. Seit den 1990er 
Jahren und zuletzt mit deutlich anziehender Forschungskonjunktur widmet 
sich die Leseforschung einem Feld, in dem Personen nicht mehr nur einzelne 
Texte lesen, sondern (multimodale) Dokumente, d. h. Texte mit zugehörigen, 
bedeutungsrelevanten Metadaten über die Texte. Für die lesende Person ist 
dieses quantitative Mehr an zu verarbeitenden Texten nicht folgenlos. Sie kann 
nicht mit einer Kohärenzerwartung die Texte lesen, sondern muss im Lesepro- 
zess selbst erkennen, welche Informationen welcher Text zum übergeordneten 
Thema offeriert und wie diese Texte im Verhältnis untereinander stehen. Diese 
Texte können zudem verschiedenster Art sein, nämlich aus verschiedenen Zei- 
ten stammen, verschiedene Modalitäten aufweisen, diversen Genres zugehören, 
ein im- oder explizites intertextuelles Verhältnis aufweisen etc. (Rouet et al., 
2019). 

All dies erfordert neue, vor allem lesestrategische Herangehensweisen. Diese 
beziehen sich im Wesentlichen auf zwei Gruppen von kognitiven Prozessen: 
das «intertextuelle Integrieren» und das «Sourcing» (Philipp, 2020). Beide Pro- 
zessgruppen zeichnen sich durch ihre jeweils unterschiedliche Funktion aus: 
Beim «intertextuellen Integrieren» geht es darum, zielbezogen Informationen 
aus einzelnen Dokumenten auszuwählen, zu strukturieren und inferenzbasiert 
stimmig zu einem kohärenten mentalen Gesamtmodell zu verschmelzen. Diese 
Prozesse führen im absoluten Optimalfall laut einer besonders einflussreichen 
theoretischen Modellierung, dem «Dokumentenmodell» (Britt & Rouet, 2012), 
zu einer Repräsentation der gelesenen Dokumente auf zwei miteinander ver- 
bundenen Ebenen. Inhaltlich ist zuvorderst die Ebene des «integrierten menta- 
len Modells» anzuführen. Auf ihr sind die separaten, aber auch geteilten Reprä- 
sentationen der Inhalte aus verschiedenen Dokumenten zu lokalisieren. D. h. 
Leserinnen und Leser haben hier durch informatorische Transformationspro- 
zesse eine Vorstellung erlangt, wovon die gelesenen Dokumente gesamthaft 
kohärent inhaltlich handeln und welche Inhalte nur aus einzelnen Dokumenten 
stammen. Die zweite Ebene wird «Intertextmodell» genannt. Sie beinhaltet das 
(intertextuelle) Verhältnis der Dokumente, also ob sich Dokumente ergänzen, 
einander widersprechen, partiell oder vollständig gleiche Perspektiven auf einen 


133 


Sachverhalt einnehmen etc. Diese Form der Repräsentation basiert auf teils 
hochinferenten Verstehensleistungen sowohl einzelner Dokumente als auch 
intertextueller Inferenzen, die zu «Intertextprädikaten» verdichtet werden (wie 
«Dokument 1 widerspricht mehrheitlich Dokument 4»). 

Auf der Ebene des Intertextmodells ist das «Sourcing» zu verorten. Denn für 
jedes Dokument sieht das Dokumentenmodell einen «Dokumentenknoten» 
vor, eine geordnete Sammlung von Metadaten über die Person(en), die das Do- 
kument verfasst hat/haben und den Erscheinungskontext (Zeit, Publikationsort 
etc.). Diese Metadaten, welche Personen evaluieren, um kommunikative Ab- 
sichten zu interpretieren und die Glaubwürdigkeit von Aussagen zu beurteilen, 
bedürfen einer vor allem vorwissensbasierten, interpretativen Verarbeitung. Sie 
werden dazu genutzt, die inhaltlichen Aussagen zu gewichten, abzulehnen, zu 
priorisieren etc. 

Wer multiple Dokumente liest, muss damit nicht nur viele qualitativ unter- 
schiedliche Informationsarten (Inhalte und Metadaten), sondern auch intra- 
und intertextuelle Informationen vorwissensbasiert kohärent in eine mentale 
Repräsentation des Gelesenen überführen. Da viele dieser Leistungen auf stark 
schlussfolgernden Prozessen basieren, die implizite Zusammenhänge sowohl 
auf der Ebene des integrierten mentalen Modells als auch des Intertextmodells 
betreffen, wirkt der kognitive Anspruchsgrad ausgesprochen hoch und wird 
auch deshalb in der Leseforschung explizit mit dem «Deep Reading» in Verbin- 
dung gebracht (Wiley & Guerrero, 2018). Mit Blick auf den Merkmalskatalog 
des «Deep Reading» aus dem Abschnitt 2.1.1 lässt sich damit plausibilisieren, 
dass das erfolgreiche Lesen multipler Dokumente viele dieser Eigenheiten 
aufweist. Besonders auffällig ist dies beim Erschließen impliziter Zusammen- 
hänge (Nr. 2 in der Liste), dem inferenzbasierten Erkennen von Zusammen- 
hängen (Nr. 3) und dem kritisch-evaluativen Lesen (Nr. 5). 


2.2 Materialgestütztes Schreiben 


Das Leseverstehen von multiplen Dokumenten ist nur ein Bestandteil des mate- 
rialgestützten Schreibens. Dem materialgestützten Schreiben ist als Format 
inhärent, dass das Lesen in Hinblick auf ein Schreibziel, auf ein zu erstellendes 
Produkt erfolgt. Dieser Zielbezug, der von Anfang an Leseprozesse beeinflusst 
bzw. metakognitiv beeinflussen sollte, wird zunehmend unter dem Stichwort 
des «Aufgabenmodells» diskutiert (Rouet & Britt, 2011). Diese metakognitive 
Steuerungseinheit ist auch vom Schreibauftrag abhängig, der als interpretierte 
und angereicherte Repräsentation Verarbeitungstiefe und Verarbeitungspro- 
zesse reguliert. Insofern gibt es auch hier eine große Überschneidung zu Merk- 
malen des «Deep Reading» aus dem Merkmalskatalog in Abschnitt 2.1.1. 
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2.2.1 Wissenstransformation — ein Prozessverbund des strategischen 
Lesens und Schreibens 


Das Konzept «Wissenstransformation» hat seine Popularität durch die Arbeiten 
von Scardamalia und Bereiter (1987) erlangt, die in den 1980er Jahren eine 
Kontrastierung von zwei expertisebedingten Formen des Schreibens vorge- 
nommen haben, nämlich das Wissen-Erzählen («Knowledge Telling») und 
eben das Transformieren des Wissens («Knowledge Transforming»). In dieser 
Gegenüberstellung ist die Wissenstransformation das elaboriertere Vorgehen, 
welches Teile des Erzählens von Wissen aber ausdrücklich beinhaltet. Die Wis- 
senstransformation geht davon aus, dass Schreiben als Problemlöseprozess 
dazu dient, beabsichtigte Inhalte des Textes (im sogenannten «inhaltlichen 
Problemlöseraum») mit der intendierten rhetorischen Umsetzung (im «rhetori- 
schen Problemlöseraum») zu harmonisieren. Um die Inhalte möglichst adäquat 
zu kommunizieren, müssen Schreibende sie so anpassen und modifizieren - 
sprich: transformieren -, dass sie Publikum, Textsorte, Inhalt und kommuni- 
kative Absicht erfolgreich adressieren. Gleichzeitig wirkt der Inhalt - vor allem 
dessen Komplexität - darauf, welche rhetorischen Ziele sich Personen beim 
Schreiben stecken und diese dynamisch anpassen. Entscheidend - auch für den 
Zweck dieses Kapitels - ist damit, dass bei der Wissenstransformation die Er- 
fordernisse der Zieltextsorte als Bestandteil der rhetorischen Ziele den gesam- 
ten Prozess des Schreibens leiten. Denn sie fungieren als metakognitive Richt- 
schnur dafür, welche Inhalte auf welche Art ausgewählt, strukturiert und mit- 
einander verbunden werden müssen, um die kommunikative Absicht einzulö- 
sen. 

Das Konzept Wissenstransformation ist originär nicht spezifisch für das 
Schreiben über einzelne Texte oder multiple Dokumente vorgelegt worden. 
Gleichwohl hat es - im Diskurs über das Fachlernen mithilfe des Schreibens - 
bis heute Konjunktur und wird als Sammelbegriff und Heuristik für verschie- 
dene Vorgehensweisen verwendet. Auf den allgemeinsten Nenner gebracht 
einen diese Vorgehensweisen planerische zielbezogene Prozesse beim Schreiben 
(Klein & van Dijk, 2019). Das lässt das Konzept für das materialgestützte 
Schreiben anschlussfähig wirken, da transformative Prozesse dort ebenfalls 
typisch, um nicht zu sagen prototypisch sind. Tatsächlich bildet das materialge- 
stützte Schreiben eine hybride Form des Lesens und Schreibens, bei der die 
Grenzen zwischen Lesen und Schreiben verwischen. Das basiert auf ähnlichen 
kognitiven Prozessen. Diese fallen domänenspezifisch zwar anders aus und 
beziehen sich auf rezeptive (Lese- und Verstehens-) und expressive (Schreib-) 
Komponenten. Allerdings haben sie eine ähnliche domänenübergreifende 
Funktion und müssen zusätzlich von der lesenden und schreibenden Person 
konzertiert und im Verbund genutzt werden (Spivey, 1990). 
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Abbildung 1: Transformationsprozesse des Auswahlens, Organisierens und Verbindens 
in ihrer Domanenspezifik im Rahmen des materialgestützten Schreibens 


Organisieren 
Struktur von inter-/intratextuellen 
Inhalten (re-)konstruieren, Aufbau eines 
integrierten mentalen Modells und der 
Intertextpradikate 


Verbinden 
Inferenzbasiertes, teils evaluatives, 
primär rekonstruierendes Elaborieren 
des Inhaltes — inkl. Sourcing 


Auswahlen 
Relevante bzw. wichtige bedeutungstragende 
Informationen in Dokumenten erkennen 


Leseprozesse 


Verbinden 
Explizites, systematisches — tlw. evaluieren- 
des — Herstellen von (inter-)textueller Kohärenz 
bzgl. Schreibgegenstand/Thema 


Auswahlen 
Inhalte bzgl. Gegenstandsadaquanz nach 
Relevanz und Wichtigkeit für das geplante 
eigene Textprodukt festlegen 


Organisieren 
Struktur der Inhalte des eigenen Textes 
schreibzielbezogen, gegenstandsangemessen 
und textsortenspezifisch planen 


Schreibprozesse 


(Quelle der eigenen Darstellung: Philipp, in Druck, basierend vor allem auf Spivey, 1990; 
Legende: durchgängige Pfeile visualisieren Interaktionen zwischen den Prozessen innerhalb der Domäne, 
gestrichelte Doppelpfeile beziehen sich auf Interaktionen zwischen Lese- und Schreibprozessen) 


Spivey (1990) hat dies herausgearbeitet, indem sie drei Transformationspro- 
zesse expliziert, die konstitutiv im materialgestützten Schreiben sind und die in 
Abbildung 1 dargestellt sind. Diese Trias - bestehend aus Auswählen, Organi- 
sieren und Verbinden - dient dazu, 


dass beim Auswählen Personen aus Dokumenten wichtige (dokumentenin- 
tern als bedeutsam rekonstruierbare) bzw. relevante (extern als bedeutsam 
zugewiesene) Informationen beim Lesen erkennen und selektieren bzw. 
beim Schreiben für den eigenen Text planerisch vorsehen; 

dass beim Organisieren die makrostrukturelle Organisation zwischen den 
Inhalten lesend intra- und intertextuell rekonstruiert wird (etwa für das in- 
tegrierte mentale Modell; 2.1.2) bzw. für das Schreiben eine eigene thema- 
tische Entfaltung (durchaus in den Konventionen der Zieltextsorte) text- 
strukturell gestaltet wird; 

dass im Falle des Verbindens die Vorwissensbestände der lesenden Person 
vor allem für intra- und intertextuelle Integrationsleistungen beim Lesen 
(Inferenzbildung) genutzt werden und beim Schreiben des eigenen Texts 
intertextuelle Kohärenz über die explizite Verknüpfung von Inhalten mit 
Vorwissen hergestellt und versprachlicht wird. 
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Diese Prozesse, und das visualisieren die Doppelpfeile in der Abbildung 1, sind 
nicht als diskrete Phasen zu verstehen, bei denen Personen zunächst lesen und 
dann schreiben und dabei jeweils auswählen, organisieren und danach verbin- 
den. Ein solches eher rigides Vorgehen ist zwar durchaus empirisch beobachtet 
worden, allerdings in der Regel von geringerem Erfolg gekrönt (Philipp, 2018; 
Vandermeulen et al., 2020). Es zeigt sich deshalb, dass ein besseres, tieferes 
Verstehen mit selbstregulatorisch orchestrierten kognitiven Prozessen des 
Transformierens für gelingendes materialgestütztes Schreiben Hand in Hand 
geht (s. auch Rickert & Philipp, i. d. B.). 


2.2.2  Zieltextsorten als Stellschraube potenziell differenzieller Effekte 


Textsorten sind konventionalisierte Formen der (schrift-)sprachlichen Kom- 
munikation, die erwartbare Elemente enthalten, um eine bestimmte kommuni- 
kative Absicht zu unterstiitzen, ohne dass tiber die Textsorte selbst schon der 
Inhalt determiniert ware. Solchen Konventionen zu folgen, erfordert zum einen 
die Transformation des Wissens vor allem im rhetorischen Problemlöseraum 
gemäß dem Konzept Wissenstransformation (Scardamalia & Bereiter, 1987). 
Zum anderen bilden im Optimalfall das Wissen darüber, welche Merkmale 
Textsorten haben und wie man solche Texte herstellt, eine wichtige Ressource 
für die metakognitive Steuerungseinheit «Aufgabenmodell» (Rouet & Britt, 
2011). 

Das Aufgabenmodell wird in der Leseforschung zunehmend stärker ge- 
wichtet. Es bezeichnet eine innerhalb der lesenden bzw. schreibenden Person 
aktiv zu konstruierende Repräsentation zum Ziel und zur Zielerreichung der 
lese- und schreibbezogenen Aktivität im Sinne einer Ziel-Mittel-Analyse, die 
ihrerseits dafür benötigt wird, nötige Aktivitäten und deren Ergebnisse zu pla- 
nen, zu überwachen und zu regulieren (Philippakos, 2018; Rouet & Britt, 2011). 
Damit bildet das Aufgabenmodell eine durchaus veränderliche Ressource der 
lesenden und schreibenden Person, um das definierte Ziel zu erreichen, z. B. 
das Schreiben einer Argumentation oder einer Zusammenfassung über den 
Klimawandel wie im Falle des Eingangsbeispiels aus Tabelle 1. Für das verste- 
hende Lesen von Dokumenten und die Nutzung dieser Dokumente für das 
Schreiben eines eigenen Texts sind die Zieltextsorten deshalb wichtig, weil sie - 
das jeweilige Wissen seitens der Leserinnen und Leser vorausgesetzt - bereits 
prinzipiell als Ressource dazu dienen, Relevanzentscheidungen zur Verwert- 
barkeit von Informationen und Dokumenten zu treffen (McCrudden, 2018). 

Dafür in Anlehnung an das Eingangsbeispiel eine Kontrastierung: Wer Zu- 
sammenfassungen schreibt, sucht vermutlich eher nach übereinstimmenden 
Themen in multiplen Dokumenten. Die Nutzung derselben Dokumente zum 
Zweck des Argumentierens zielt eher darauf ab, Positionen zu einem strittigen 
Thema zu erkennen und sie in ihren wechselseitigen Bezügen nebst kritischer 
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Evaluation der Metadaten zu verwerten. Wer zusammenfasst, wird Details til- 
gen müssen, während sie in wissenschaftsbasierten Argumentationen der per- 
suasiven Glaubwürdigkeit im Sinne von Beispielen dienen und damit alles an- 
dere als verzichtbar sind. Mit Blick auf die zielbezogene Verwertbarkeit von 
Informationen oder sogar ganzen Texten bilden geforderte Zieltextsorten als 
externe Vorgaben nur den Ausgangspunkt der strategischen Kognitionen. 
Denn Zieltextvorgaben müssen in eine internale Variante überführt werden: als 
Teil des Aufgabenmodells, das Kohärenzstandards und Relevanzstandards 
gleichermaßen beeinflusst - und damit die Art und das Maß, wie Personen 
strategische Transformationsprozesse bemühen (McCrudden, 2018; Philippa- 
kos, 2018). 

Die Zieltextsorten beim Schreiben haben als ein potenzieller Einflussfaktor 
von mehreren bereits die Aufmerksamkeit der Leseforschung in Theorie und 
Praxis auf sich gezogen (Rouet & Britt, 2011; Wiley, Jaeger & Griffin, 2018). 
Dabei, so resümieren Rouet et al. (2019, S. 369), sind solche Aufgaben vielver- 
sprechend, die intra- und intertextuelle Integrationsprozesse einfordern, und 
als Beispiel bemühen sie explizit Argumentationen. Tatsächlich dominiert die 
Argumentation die untersuchten Zieltextsorten sowohl in angewandter For- 
schung (Philipp, 2020) als auch in Grundlagenforschung (Primor & Katzir, 
2018); meist in Verbindung mit Dokumentensets, die inhaltliche Widersprüche 
aufweisen. Der Nutzen konfligierender Dokumente gilt im Sinne der Salienz 
von intertextuellen Bezügen als besonders lernförderlich (Britt & Rouet, 2012) 
und dürfte die Wahrscheinlichkeit erhöhen, diverse Transformationsprozesse 
zu absolvieren, darunter das Sourcing (Philipp, 2020), um Widersprüche nicht 
nur zu erkennen, sondern auch zu erklären. Allerdings ist in bisherigen For- 
schungsüberblicken unklar, ob diese Zieltextsorte (in Verbindung mit einer 
bestimmten Variante von Dokumentensets) konsistent günstiger für Verste- 
hensleistungen ist. Dies ist Anlass des vorliegenden quantitativen Reviews. 


3 Methode 


3.1 Fragestellungen 


Dieser Beitrag hat das Ziel, den differenziellen Effekten der Zieltextsorte beim 
materialgestützten Schreiben auf produktbezogene Leistungsmaße nachzuge- 
hen. Drei Fragestellungen sind hierfür leitend: 


e Bei welchen Zieltextsorten lassen sich studienübergreifend Vor- und Nach- 


teile bei den abhängigen Variablen in expressiven bzw. rezeptiven Leis- 
tungstests finden? 
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e Welche Effekte bestehen in puncto intertextueller Zusammenstellung der 
Dokumentensets? 

e Welche Effekte ergeben sich aus der Kreuzklassifikation von Leistungstest 
(expressiv/rezeptiv) und intertextuellem Verhältnis der Dokumente im ver- 
wendeten Dokumentenset (kontrastiv/komplementär)? 


3.2 Zur Auswahl der Primarstudien 


Um die Fragestellungen zu beantworten, wurden per Schneeballsystem ausge- 
hend von drei frühen, zentralen Studien (Voss & Wiley, 1997; Wiley & Voss, 
1996, Wiley & Voss, 1999) Experimente recherchiert. Für die Auswertung im 
Rahmen dieses Beitrags mussten die Studien folgende Inklusionskriterien er- 
füllen: 


e Die Experimentalgruppen schrieben auf der Basis eines identischen Sets von 
mindestens zwei Dokumenten einen eigenen Text, dessen Länge nicht defi- 
niert war, aber im Schreibauftrag als Zieltextsorte eindeutig benannt wurde. 

e Der Schreibauftrag sah es vor, dass jede Experimentalgruppe eine Zieltext- 
sorte verfasste, und jede Testperson schrieb nur einen Text. 

e Die Auswirkungen der Schreibaufträge wurden in einem Produktmaß er- 
fasst. Dieses Produktmaß konnte aus expressiven (freie, nicht vorab vorge- 
gebene Antwort in aller Regel in einem Textprodukt erfasste Leistung) 
und/oder rezeptiven Tests (mittels geschlossener oder nur sehr kurzer Ant- 
wortformate) stammen. 

e Die Effekte der unabhängigen Variablen mit expressiven bzw. rezeptiven 
Maßen wurden mit einem geeigneten statistischen Verfahren als Paarver- 
gleiche zwischen den Experimentalgruppen mit verschiedenen Zieltextsor- 
ten bestimmt, wobei das Signifikanzniveau der Vergleiche bei p < .05 liegen 
musste. 

e Die Studien wurden auf Englisch in Fachzeitschriften mit Peer-Review bis 
Juni 2020 publiziert. 


Das Ergebnis von Recherche und Anwendung der Kriterien sind 18 gefundene 
Experimente, die teils über mehrere Publikationen veröffentlicht wurden. Eine 
Übersicht über die Studien gibt - schon mit einigen Kodierungen - die Ta- 
belle 2. 
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Tabelle 2: Überblick über die 18 kodierten Primärstudien 


Test- Mate- Zieltextsorten 
personen rialien und abhangige Variablen 
A 3 S a 
2 © A lé 5 5 
a oc 
â 2 = N g 5 £ ET 3 2S 
A zu 9S |zs|Elsss g zea 
25 gel tg e2|5|s532|° © CO 8 
y ES HO) 95 Nx ||la? = Jaz 
Nr. | Studie Z N |2 E| ES |s2 <s INNE < eas 
1 |DeLaPaz& Kl. 11 101 3 > | kon- 2 + + 8 
Wissinger (2015) trastiv 
2 |Du&List(2020) | Studie- 32 6 | kontra- 2 + Bericht 3 
rende stiv 
3 | Giletal.(2010a), | Studie- 87 5 | kontra- 2 + + 5 
Experiment 1 rende stiv 
4 | Gil etal. (2010a), | Studie- 47 5 | kontra- 2 + + 4 
Experiment 2 rende stiv 
5 |Giletal.(2010b) | Studie- 53 7 | kontra- 2 + + 6 
rende stiv 
6 |Hemmerich & Studie- 40 | k.A.|k.A. 2 + Essay 1 
Wiley (2002), rende 
Studie 2 
7 | Lacroix (1999), Studie- 160 4 | komple- 2 + Bericht 2 
Experiment 2 rende mentar 
8 | Le Bigot & Rouet | Studie- 52 7 | komple- 2 + + 14 
(2007) rende mentar 
9 | Lehmann etal. Studie- 93 3 | komple- 2 + unbe- 11 
(2019, 2020) rende mentär stimmte 
Text- 
sorte 
10 | List et al. (2019), | Studie- 143 6 |kontra- 2 + Bericht 5 
Studie 1; Wang & | rende stiv 
List (2019) 
11 | Naumann etal. Studie- 119 | 8 | kontra- 2 + + 14 
(2009) rende stiv 
12 | Stadtler et al. Studie- 189 9 | kontra- 3 + + Schlüs- 4 
(2014) rende stiv selwör- 
ter 
13 | Voss & Wiley Studie- 96 8 | komple- 3 + + | Ge- 7 
(1997) rende mentar schicht- 
liche 
Dar- 
stellung 
14 | Wiley (2001), Studie- 30 | 11 | komple- 2 + + 3 
Experiment 1 rende mentär 
15 | Wiley (2001), Studie- 40 | 19 | komple- 2 + + 3 
Experiment 2 rende mentär 
16 | Wiley & Voss Studie- 60 8 | komple- 3 + + | Ge- 9 
(1996) rende mentär schicht- 
liche 
Dar- 
stellung 
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Test- Mate- Zieltextsorten 
personen rialien und abhangige Variablen 
i 3 S w 
2 3 ells l£ 5 
O 5 2 OF | #0 2 
a RE |NElaleEw so) p Bo 
b zoj 25 zs|eEelES| = © ze3 
> o © E > c RE 3/6 7] 9 o GO © 
i £2 Be) 25 | 2% |/P Sais) 2 |255 
Nr. | Studie z N |3 E| ES |3 | z|NEo < |<s> 
17 | Wiley & Voss Studie- 64 8 | komple- 4 + + + | Erkla- 9 
(1999), Experi- rende mentär rung 
ment 1 
18 | Wiley et al. Studie- 110 7 | komple- 2 + + 8 
(2009), Experi- rende mentar 
ment 1 


Legende: + = Zieltextsorte der drei am haufigsten vorkommenden Zieltextsorte wurde in jeweiligem 
Experiment berücksichtigt, K. A. = keine Angabe) 


3.3 Kodierungen und Auswertung 


Die 18 Experimente wurden nach Anzahl und Altersgruppe der Testpersonen, 
der Zahl eingesetzter Dokumente und dem intertextuellen Verhältnis der Do- 
kumente im Set (komplementär vs. kontrastiv),' der Anzahl geschriebener 
Zieltextsorten und der Art der Zieltexte sowie - besonders wichtig - in puncto 
abhängiger Variablen kodiert. Dabei war eine entscheidende Weichenstellung, 
dass nur die drei häufigsten Zieltextsorten - Argumentationen (in 17 Experi- 
menten), Zusammenfassungen (8) und Beschreibungen (7) - genauer betrach- 
tet wurden. Die Tabelle 2 enthält die Ergebnisse der Kodierungen. Feingliedri- 
ger wurde danach kodiert, welche abhängigen Variablen genutzt wurden. Weil 
diese Variablen sehr heterogen waren, erfolgte zunächst eine Unterscheidung in 
expressive und rezeptive Tests. Innerhalb dieser beiden Gruppen wurde ge- 
nauer kodiert, zum einen welche drei Transformationsprozesse die abhängigen 
Variablen betrafen und zum anderen welche Arten von Transformationen die 
Tests erfassten. Beides stützt sich auf ein Kodierschema, welches von Primor 
und Katzir (2018) bereits verwendet wurde. 


Die drei Prozesse des Transformierens sind dabei deutlich anschlussfähig an das, 
was im Abschnitt 2.2.1 beschrieben wurde: 


1) Informationsauswahl, verstanden als Maß für die Selektion von nötigen 
Informationen aus Dokumenten für die korrekte Nutzung in Antworten; 


1 Das intertextuelle Verhältnis konnte im Falle einer Studie (Hemmerich & Wiley, 2002, 
Studie 2) nicht bestimmt werden. Deshalb kann diese Studie in Analysen, bei denen das 
intertextuelle Verhältnis zur Unterscheidung von Gruppen nötig ist, nicht berücksichtigt 
werden. 
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2) Generieren von Dokumentenrelationen: das organisierende Verknüpfen von 
Informationen über Dokumentengrenzen hinweg, vor allem zum Zweck des 
Klärens des Verhältnisses von Informationen untereinander; 

3) Inferenzbildung als Indikator stark vorwissensbasierter Anreicherungen 
oder sonstiger hochinferenter Transformationen bzw. Verbindungen. 


Ergänzend ließen sich drei Arten von Transformationen kodieren: 


1) linguistische Transformationen - Maße, die sich auf sprachliche Verände- 
rungen oder die sprachliche Wiedergabe von Informationen aus Dokumen- 
ten beziehen; 

2) rhetorische Transformationen - Indikatoren für die strukturelle Transfor- 
mation von Inhalten aus Dokumenten; 

3) konzeptuelle Transformationen - Variablen, die die Inhalte selbst und ihre 
(sich durch die Anwendung verändernde) Nutzung in den Tests betreffen. 


Jeder einzelne Paarvergleich aus den 18 Experimenten wurde den jeweiligen 
drei Arten und drei Prozessen der Transformation - jeweils aufgegliedert nach 
expressiven und rezeptiven Maßen - zugeordnet (s. Tabelle 3 für die expressi- 
ven Tests und Tabelle 4 für die rezeptiven Tests). Für jeden Paarvergleich 
wurde dann im Sinne eines Vote-Count-Ansatzes (Bushman & Wang, 2009) für 
jede der beiden verglichenen Zieltextsorten kodiert, ob es entweder a) ein sta- 
tistisch signifikantes positives Ergebnis (Überlegenheit) im Paarvergleich gab, 
b) ein signifikantes negatives Ergebnis vorlag (Unterlegenheit) oder c) keine 
signifikante Differenz bestand (kein Effekt). Das bedeutet, ein Paarvergleich in 
einer Variable erbrachte immer zwei Ergebnisse, z. B. eine Überlegenheit für die 
Zieltextsorte Argumentation und eine Unterlegenheit bei der mit der Argu- 
mentation verglichenen Beschreibung. 

Diese Kodierungen wurden dann studienübergreifend zusammengefasst 
und ermittelt, wie viele positive, neutrale/keine und negative Effekte pro Pro- 
zess und pro Art von Transformationen vorlagen, sodass sechs vertiefte Aus- 
wertungen und abstrahierte Gesamtwerte pro Zieltextsorte das Ergebnis bilde- 
ten. Dabei wurde zusätzlich noch danach differenziert, ob das intertextuelle 
Verhältnis komplementär oder kontrastiv war und ob es sich bei der Gruppe 
abhängiger Variablen um expressive oder rezeptive Maße handelte. Zwecks 
Vergleichbarkeit wurden diese Zählungen in Prozentangaben überführt und in 
Balkendiagrammen zusammengefasst. Lagen in einer Auszählung weniger als 
vier Paarvergleiche vor, erfolgte keine gesonderte Auswertung. 
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Tabelle 3: Überblick über eingesetzte Testverfahren zur Erfassung von expressiven 


Leistungen 
Transforma- 
tionsart | Linguistische Rhetorische Konzeptuelle 
Transformationen Transformationen Transformationen 
Prozess 


Informations- 
auswahl 
(Auswählen) 


— Paraphrasen oder 
wortwortliche 


Übernahmen &:2: 
11,16, 17] 


Referenzen zu den 
Quellen: a) ver- 
schiedene Arten von 
Referenzen ® 1112], 
b) Anzahl Zitationen 
[2, 10, 11] 

Lange des eigenen 
Textes: a) Anzahl 
Sätze [13, 16, en); 

b) Wortzahl | ®) 
Anzahl der ver- 
wendeten Doku- 
mente [° 5] 


— Abdeckung von 
Hauptaussagen 
bzw. Argumenten 
[7, 13, 16, 18] 

— Verhältnis von 
konzeptueller und 
propositionaler 
Übereinstimmung 
(«Balanced Se- 
mantic-Matching»- 
Koeffizient) 9 

— Inakkurate Kon- 
zepte (invers ko- 
diert) #2) 


Generieren von 
Dokumenten- 
relationen 
(Organisieren) 


— Anzahl einzelner 
Arten von Konnek- 
toren: a) kausale 
Konnektoren ® 11: 
13, 16, in b) 4 wei- 
tere verschiedene 
Konnektoren ®! 

- Gesamtanzahl 
Konnektoren [2 1% 
13, 16, 17] 

— Verknüpfungen 

von Informationen 

in Sätzen 6 

Anzahl integrativer 

Aussagen im eige- 

nen Text 9 


Anzahl Wechsel 
zwischen den Do- 
kumenten im eige- 
nen Text 3:4: 91 
Textstruktur: Analy- 
sestruktur vs. Liste 
[11, 13, 16] 
Textqualitat: Ausge- 
wogenheit in der 
Themenentwicklung 
und Integration 1° 
Textstruktur Uber 
Summenscore von 
fünf Teildimensio- 
nen, davon drei zur 
Textstruktur * 
Ubereinstimmung 
von Vernetzungen 
der Propositionen 
mit Musterlösungen 
(«Gamma»-Koeffi- 
zient) 9 
Reihenfolge der 
thematischen Ent- 
wicklung "7 


— Adaquanz des 
beschriebenen 
Sachverhalts als 
Kausalmodell © +8! 

— Typologie menta- 
ler Modelle 19 

— Integrative, inter- 
textuelle Elabora- 
tion 9 

— Nicht-integrative, 
intratextuelle Ela- 
boration ©! 

— Zweiseitiges 
Berichten von in- 
tertextuellen Kon- 
flikten 2] 

— Einseitiges Berich- 
ten von intertex- 
tuellen Konflikten 
(invers kodiert) "2! 
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Transforma- 


(Verbinden) 


basierte Trans- 
formationen von 


Inhalten & 44 44.45. 
16,17] 


tionsart | Linguistische Rhetorische Konzeptuelle 
Transformationen Transformationen Transformationen 
Prozess 
Inferenzen — Anzahl Elaboratio- | - - Gesamtscore 
bilden nen/vorwissens- Transformationen 


(gebildet aus 
mehreren Einzel- 
indizes) [+ 3 4 5131 

— Anzahl von Hinzu- 
fügungen [8, 9, 11, 16, 
17] 

— Anzahl irrelevan- 
ter Hinzufügungen 
(invers kodiert) 4 

— Fähigkeiten zum 
historischen Den- 
ken gemäß eige- 
nem Text ® 


Darstellung nach Primor & Katzir, 2018, S. 12; hochgestellte Zahlen in eckigen Klammern geben die 


Nummer der Studien aus Tabelle 2 an, in denen ein Test zum Einsatz gekommen ist; 
— = keine Studien vorhanden) 


Tabelle 4: Überblick über eingesetzte Testverfahren zur Erfassung von rezeptiven 


Leistungen 
Transforma- a 
; . A: Rhetorische 

tionsart | Linguistische Konzeptuelle 

: Transforma- A 

Transformationen z Transformationen 
tionen 
Prozess 


Informations- 
auswahl 
(Auswählen) 


— Beurteilung der 
inhaltlichen Gültig- 
keit von paraphra- 
sierten Sätzen (Sen- 
tence Verification 
Task) [3, 4, 5, 17, 18] 

— Wiedererkennen 
von vorhandenen 
bzw. nicht-vorhan- 
denen Sätzen 14) 


— Wissenstests 914 

— Fragen zu mikro- und 
makrostrukturellen In- 
formationen ©! 

— Beurteilung der Wichtig- 
keit von Aussagen in 
Texten 3) 

- Erinnerung an Textin- 
halte [6 

— Intratextuelle Verifika- 
tionsaufgabe © 


Generieren von 
Dokumenten- 
relationen 
(Organisieren) 


— Beurteilung der Gültig- 
keit von Aussagen mit 
integriertem Inhalt (Infe- 
rence Verification Task) 
[3, 4,5, 9, 11, 14, 15, 17] 

— Lesetest zu mikro- und 
makropropositionalen 
Inferenzen ® 

- Erinnerung an konfligie- 
rende Informationen aus 
den Dokumenten "2! 
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Transforma- 


tionsart | Linguistische Rhetorische 


Konzeptuelle 


3 Transforma- s 
Transformationen i Transformationen 
tionen 
Prozess 
Inferenzen bilden - - — Beurteilung von Analo- 
(Verbinden) gien 14.13] 


— Bilden von Inferenzen 7 

— Einschätzung der Glaub- 
würdigkeit von Websites 
118] 

— Einschätzung der Kor- 
rektheit von fremden 
Texten 2) 


Darstellung nach Primor & Katzir, 2018, S. 12; hochgestellte Zahlen in eckigen Klammern geben die 
ummer der Studien aus Tabelle 2 an, in denen ein Test zum Einsatz gekommen ist; 
— = keine Studien vorhanden) 


4 Ergebnisse 


In den 18 Experimenten wurden insgesamt 1.516 Testpersonen getestet, im 
Mittel waren das 84 Personen pro Experiment. Die Anzahl der Experimente mit 
komplementären (9) und kontrastiven (8) Dokumentensets war relativ ausge- 
wogen. Die Mehrzahl der Experimente (14) setzte auf zwei Zieltextsorten. Bei 
der Anzahl der abhängigen Variablen war die Spanne mit einem Spektrum von 
1 bis 14 hoch und lag bei einem Medianwert von 5,5. 

Die Resultate der 313 Paarvergleiche, das Herzstück der Auswertung, sind 
in Form zweier Balkendiagramme zusammengetragen. Die Abbildung 2 bein- 
haltet - zur leichteren Kommunikation mittels Verweisen sind die Variablen 
alphanumerisch durchgezählt - Prozesse und Art der Transformationen separat 
ausgewiesen und die aggregierten Gesamtwerte. Die Sortierung folgt dabei der 
Unterscheidung von Werten zu expressiven und rezeptiven Tests und danach 
dem intertextuellen Verhältnis der Dokumente untereinander. Die Abbildung 3 
folgt diesem Darstellungsmuster prinzipiell, hat aber die Testform mit inter- 
textuellem Verhältnis kreuzklassifiziert und erlaubt damit vertiefende Einblicke 
in die Zusammenhänge dieser beiden unabhängigen Variablen. 
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Abbildung 2: Übersicht über Verteilung der Paarvergleiche in den expressiven und 
rezeptiven Leistungstests beim materialgestützten Schreiben von drei Zieltextsorten, 
aufgeschlüsselt nach Prozess und Art der Transformationsleistungen 


A) Alle Paarvergleiche (A: 152*, Z: 74, B: 87) 
A1) davon expressiv (A: 108", Z: 49, B: 61) 

A2) davon rezeptiv (A: 44, Z: 25, B: 26) 

A3) davon kontrastiv (A: 53, Z: 31, B: 14) 

A4) davon komplementär (A: 98, Z: 43, B: 73) 


B) Informationsauswahl — alle (A: 57, Z: 26, B: 34) 
B1) davon expressiv (A: 36, Z: 15, B: 23) 

B2) davon rezeptiv (A: 21, Z: 11, B: 11) 

B3) davon kontrastiv (A: 21, Z: 11, B: 8) 

B4) davon komplementar (A: 36, Z: 15, B: 26) 


C) Dokumentenrelationen — alle (A: 59", Z: 30, B: 27) 
C1) davon expressiv (A: 45*, Z: 19, B: 21) 

(2) davon rezeptiv (A: 14, Z: 11, B: 6) 

(3) davon kontrastiv (A: 22, Z: 13, B: 3) 

C4) davon komplementär (A: 36, Z: 17, B: 24) 


D) Inferenzenbildung — alle (A: 36, Z: 18, B: 26) 
D1) davon expressiv (A: 27, Z: 15, B: 17) 

D2) davon rezeptiv (A: 9, Z: 3, B: 9) 

D3) davon kontrastiv (A: 10, Z: 7, B: 3) 

D4) davon komplementär (A: 26, Z: 11, B: 23) 


E) Linguistische Transformationen — alle (A: 50, Z: 26, B: 35) 
E1) davon expressiv (A: 41, Z: 20, B: 29) 

E2) davon rezeptiv (A: 9, Z: 6, B: 6) 

£3) davon kontrastiv (A: 12, Z: 4 B: 5) 

E4) davon komplementär (A: 38, Z: 22, B: 30) 


F) Rhetorische Transformationen — alle (A: 33, Z: 15, B: 16) 
F1) davon expressiv (A: 33, Z: 14, B: 16) 

F2) davon rezeptiv (A: 0, Z: 1, B: 0) 

F3) davon kontrastiv (A: 18, Z: 9, B: 5) 

F4) davon komplementär (A: 15, Z: 6, B: 11) 


G) Konzeptuelle Transformationen — alle (A: 69*, Z: 33, B: 36) 
G1) davon expressiv (A: 34", Z: 15, B: 16) 

G2) davon rezeptiv (A: 35, Z: 18, B: 20) 

G3) davon kontrastiv (A: 23, Z: 18, B: 4) 

G4) davon komplementär (A: 45, Z: 15, B: 32) 


Argumentation Zusammen- Beschreibung 
fassung 

6 ps 0 E 
6 KH 64 
76 73 

52 21/21 57 
mi 75 
69 alló 74 
67 65 
73 91 [9 

5 132 WW 
a so pa s E 
7 H 6 

21 7) 38 
73 67 

4 IH 

67 
Eu 


2| 4 Pol 7 63 
al 4 Pal 7 63 
28| 50 3| o | 100 

20] 80 83 17 91 9] 
235| 6s 18] 70 309 WU 
[29| 59 i3 60 6 6 25 | 
2 71 92 78 70 
m 52 EJ 3] 50 25| 50 BE 
27| 73 93 2 


(Anzahl der jeweiligen Paarvergleiche (PV) in der Y-Achse angegeben: 
A= Anzahl PV bei Argumentationen; Z = Anzahl PV bei Zusammenfassungen; 
B= Anzahl PV bei Beschreibungen; Zahlen im Balkendiagramm geben gerundete Prozente an, 


Abweichungen von 100 Prozent basieren auf Rundungsfehlern; 


* = Experiment von Hemmerich & Wiley, 2002, Studie 2, in Analyse berücksichtigt) 
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© Positiver Effekt C Kein Effekt mi Negativer Effekt 


Abbildung 3: Übersicht über Verteilung der Paarvergleiche in den expressiven und 
rezeptiven Leistungstests beim materialgestützten Schreiben von drei Zieltextsorten, 
aufgeschlüsselt in der Kombination von Prozess und Art der Transformations- 
leistungen 


Argumentation Zusammen- Beschreibung 
fassung 


H) Alle Paarvergleiche (A: 151, Z:74,B:87) |26| 60 
H1) davon expressiv-kontrastiv (A: 39, Z: 21, B: 10) 3] 46 
H2) davon expressiv-komplementär (A: 68, Z: 28, B: 51) 2] 62 6816 
H3) davon rezeptiv-kontrastiv (A: 14, Z: 10, B: 4) ha 50 
H4) davon rezeptiv-komplementär (A: 30, Z: 15,B:22) |20] 80 


|) Informationsauswahl— alle (A: 57, Z: 26, B: 34) ha 68 
11) davon expressiv-kontrastiv (A: 13, Z: 6, B: 5) ji 31| 46 
12) davon expressiv-komplementär (A: 23, Z: 9, B: 18) i 70 
13) davon rezeptiv-kontrastiv (A: 8, Z: 5, B: 3) 
14) davon rezeptiv-komplementär (A: 13, Z:6,B:8) | 100 


J) Dokumentenrelationen — alle (A: 68, Z: 30, B: 27) | 63 37 
J1) davon expressiv-kontrastiv (A: 16, 2:8, B: 2) nal 
J2) davon expressiv-komplementär (A: 28, Z: 11,B: 19) | 68 
J3) davon rezeptiv-kontrastiv (A: 6, Z: 5, B: 1) 
J4) davon rezeptiv-komplementär (A: 8, Z: 6, B:5) | 60 40 


K1) davon expressiv-kontrastiv (A: 10, Z:7,B:3) |20] 40 
K2) davon expressiv-komplementär (A: 17, Z: 8, B: 14) | 41 59 63 38 79 
K3) davon rezeptiv-kontrastiv (A: 0, Z: 0, B: 0) 
K4) davon rezeptiv-komplementär (A: 9, Z:3,B:9) | 44 56 | 56 E 


L) Linguistische Transformationen — alle (A: 50, Z: 26, B: 35) 30] so Ma] 65 IE) 66 26 
L1) davon expressiv-kontrastiv (A: 7,2:1,B:3) 14 29 WET] 


L2) davon expressiv-komplementär (A: 34, Z: 19, B:26) | 38 50 | 68 21 (ES) 
L3) davon rezeptiv-kontrastiv (A: 5, Z:3,B:2) [20] 40 WET) 
L4) davon rezeptiv-komplementär (A: 4, Z: 3, B: 4) 100 100 


M) Rhetorische Transformationen —alle (A: 33, 7:15,8:16) [24] 64 Wal 73 ë H & 
M1) davon expressiv-kontrastiv (A: 18, Z: 9, B: 5) |28| 50 Bry 33 67 100 

M2) davon expressiv-komplementar (A: 15, Z: 5, B: 11) 20] 80 80 20 91 19] 

M3) davon rezeptiv-kontrastiv (A: 0, Z: 0 B: 0) 

M4) davon rezeptiv-komplementär (A: 0, Z: 1,B:0) | 


N) Konzeptuelle Transformationen — alle (A: 68, 7: 33, B: 36) al 66 18 72 EB 6 28 | 
N1) davon expressiv-kontrastiv (A: 14,2:11,B:2) |21| 50 EH 18| 5 WU 

N2) davon expressiv-komplementär (A: 19, Z:4,B:14) | 32 | 68 75 25 79 
N3) davon rezeptiv-kontrastiv (A:9,2:7,B:2) 17 56 WEM 57 | 43 | 

N4) davon rezeptiv-komplementar (A: 26, Z: 11, B: 18) [BI 77 100 67 


C Positiver Effekt C Kein Effekt W Negativer Effekt 


(Anzahl der jeweiligen Paarvergleiche (PV) in der Y-Achse angegeben: 

A= Anzahl PV bei Argumentationen; Z = Anzahl PV bei Zusammenfassungen; 

B= Anzahl PV bei Beschreibungen; Zahlen im Balkendiagramm geben gerundete Prozente an, 
Abweichungen von 100 Prozent basieren auf Rundungsfehlern) 
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4.1 Argumentationen 


Argumentationen haben allgemein keine klare Überlegenheit (gerade auch mit 
Blick auf die negativen Effekte, s. A). Dennoch deuten sich Überlegenheiten 
eher in den expressiven Tests (A1) und bei komplementären Dokumentensets 
(A4) an. 

Betrachtet man die Transformationsprozesse, fallen die geringeren positiven 
Effekte vor allem bei der Informationsauswahl auf (B, C, D). Während inner- 
halb der Informationsauswahl keine klaren Muster erkennbar sind (B1-B4, I1- 
14), sieht dies bei den Dokumentenrelationen und der Inferenzbildung anders 
aus. Dort zeigt sich nämlich, dass expressive Aufgaben mit komplementären 
Dokumentensets besonders häufig zu günstigeren Ausprägungen führten (C1, 
C4, D1, D4, J2, K2). Kontrastive Dokumentensets waren hingegen eher lern- 
hinderlich (C3, D3, J1, J3, K1). 

Hinsichtlich der Transformationsarten waren eher die expressiven Tests und 
Experimente mit komplementären Dokumentensets mit eindeutiger positiven 
Ergebnissen zugunsten des argumentierenden Schreibens assoziiert (E1, E4, F1, 
F4, G1, G4). Dies zeigt sich, wo die Kreuzklassifikationen genügend Paarver- 
gleiche enthielten, auch in der Kombination (L2, M2, N2). 

Insgesamt scheinen Leistungen mit höherem Anspruchsgrad hinsichtlich 
der intertextuellen, inhaltlichen Transformation dann besser zu sein, wenn die 
Aufgaben auf expressive Formate und auf komplementäre Dokumentensets 
setzten. Allerdings ist bei keiner der Auswertungen der Anteil der positiven 
Effekte höher als 43 Prozent (J2). 


4.2 Zusammenfassungen 


Zusammenfassungen als informierende Zieltextsorte haben allgemein positive 
Effekte dort in Paarvergleichen erbracht, wo die abhängigen Variablen rezeptiv 
erfasst wurden (A2) und bei intertextuell konfligierenden Dokumentensets 
(A3). Der Vorteil inhaltlich divergierender Dokumentensets zeigte sich durch- 
gängig bei den Transformationsprozessen (B3, C3, D3), ist allerdings aber auf 
das Zusammenspiel mit rezeptiven Aufgaben zurückzuführen (B2, C2, 13, J3). 
Bei expressiven Aufgaben sind bei den konfligierenden Dokumentenrelationen 
(C1) und den Inferenzbildungen (D1) nachteilige Effekte hingegen doppelt so 
häufig wie vorteilhafte. 

Die Transformationsarten ähneln dem bisherigen Muster: Kontrastive Do- 
kumentensets (E3, F3, G3) und rezeptive Aufgaben (E2, G2) zeigen konsisten- 
tere Vorteile. Komplementäre Dokumentensets (E4, F4, G4) und expressive 
Tests (E1, G1) weisen teils ein gegenteiliges Muster auf. Die Kreuzkombinatio- 
nen aus Abbildung 3 erbringen kein eindeutig interpretierbares Muster, zumal 
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häufig nur wenige oder für die Auswertung zu geringe Paarvergleichsanzahlen 
vorliegen. 

Als Muster lässt sich aber für die Zusammenfassungen als Zieltextsorte fest- 
halten, dass allgemein rezeptive Tests und kontrastive Dokumentensets recht 
durchgängig zu höheren Leistungen führen. Dies ist ein anderes Muster als 
noch bei den Argumentationen. 


4.3 Beschreibungen 


Die Beschreibungen als zweite informierende Textsorte fallen insofern auf, als 
hier die negativen Effekte in den Paarvergleichen im Verhältnis zu den positi- 
ven Effekten mit wenigen Ausnahmen (E3, G3) die Regel bilden (s. Blöcke A 
und H in den beiden Balkendiagrammen). Das übergeordnete Muster sowohl 
bei den Prozessen (Blöcke B-D) als auch den Arten der Transformationen (Blö- 
cke E-G) zeichnet sich dadurch aus, dass Beschreibungen zu entweder über- 
wiegend vergleichbaren oder schlechteren Testleistungen in den Experimenten 
führten. Die Kombination von den Merkmalen Test und Dokumentenset, die 
ähnlich wie bei den Zusammenfassungen von teils zu wenig auswertbaren 
Paarvergleichen betroffen ist, erbringt in der Tendenz das gleiche Muster wie 
die separate Betrachtung beider Merkmale. Damit deutet sich an, dass das Ver- 
fassen einer Beschreibung im Vergleich mit den anderen untersuchten Ziel- 
textsorten keinen Vorteil mit sich bringt, sondern allenfalls sogar eher schlech- 
tere Leistungen in Experimenten zeitigt. 


5 Fazit 


5.1 Die Ergebnisse in der Essenz 


Die titelgebende Frage des Beitrags lautete, ob das argumentative materialge- 
stützte Schreiben dem informierenden überlegen ist. Auf der Basis des Deep- 
Reading-Konzepts lässt sich mit Blick auf textsortenspezifisch differenziell 
ausfallende Transformationsprozesse annehmen, dass in Aufgabenstellungen 
verlangte Zieltextsorten differenzielle Effekte in Produkten nach sich ziehen. Im 
Rahmen einer produktbezogenen Sekundäranalyse von 18 Experimenten mit 
Studierenden und älteren Sekundarschuljugendlichen wurden für die drei em- 
pirisch am häufigsten untersuchten Zieltextsorten studienübergreifende Muster 
im Sinne eines Vote-Countings erfasst. Die Ergebnisse, die insgesamt keine 
eindeutige Überlegenheit einer Zieltextsorte über alle Studien hinweg demons- 
trierten, lauten wie folgt: 
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e Das materialgestützte Argumentieren ist dann eher überlegen, wenn die 
Leistungen das Schreiben und das intertextuelle Transformieren von kom- 
plementären Inhalten erfordern. 

e Das materialgestützte Informieren - übrigens mit einer Ausnahme (Lacroix, 
1999) immer auch direkt mit dem materialgestützten Argumentieren in den 
Experimenten direkt verglichen - weist je nach Zieltextsorte unterschiedli- 
che Befundlagen auf. Das Beschreiben wirkt relativ durchgängig unterlegen, 
während das Zusammenfassen bei rezeptiven Tests und auf der Basis kon- 
trastiver Dokumentensets tendenzielle Vorteile aufweist. 


Es scheint damit, als wäre das materialgestützte Zusammenfassen zumindest 
zum Teil das Gegenstück zum materialgestützten Argumentieren. Die Antwort 
auf die im Kapiteltitel aufgeworfene Frage lautet daher ganz allgemein: Zum 
Teil ist das materialgestützte Argumentieren in Produktmaßen überlegen. 
Etwas kontraintuitiv mutet der Befund an, dass das Argumentieren auf der 
Basis von komplementären Dokumentensets und das Zusammenfassen bei 
inhaltlich kontrastierenden Dokumenten tendenzielle Überlegenheiten de- 
monstrierten. Möglicherweise spielen hier die in den Primärstudien nicht oder 
nur wenig geprüften Interaktionen zwischen Dokumentensets, Aufgabe und 
individuellen Merkmalen wie dem Vorwissen eine Rolle (Britt & Rouet, 2012). 
Allerdings lässt sich der Befund auch darüber erklären, dass es möglich ist, dass 
die Transformation von konvergierenden Informationen in ein argumentatives 
Schema bzw. von konfligierenden Informationen in die Logik von Zusammen- 
fassungen mehr strategisches elaboratives Inferieren verlangt (van den Broek, 
Beker & Oudega, 2015). Es geht also um ein Transformieren der Informationen 
zum Zweck der Aufgabenerfüllung (Spivey, 1990), was tiefere Verarbeitungen 
im Sinne des Deep Readings nach sich zieht - möglicherweise auch im Sinne 
einer lernförderlichen «wünschenswerten Erschwernis» (Bjork & Bjork, 2011). 
Auch dies wäre mit Studien zu unterfüttern, die sich auf Prozesse und Zwi- 
schenprodukte wie Notizen konzentrieren (List, Du & Lee, in Druck). 


5.2 Forschungsperspektiven 


Argumentieren und Zusammenfassen zählen im Inventar der schreibbasierten 
schulischen Förderung von Leseverstehen und Fachlernen zu den effektivsten 
Förderansätzen (Graham & Hebert, 2011; Graham, Kiuhara & MacKay, 2020), 
allerdings ist die relative Überlegenheit noch längst keine ausgemachte Sache, 
teils noch nicht einmal in Studien vergleichend untersucht (Hebert, Gillespie & 
Graham, 2013). Hier hat dieser Forschungsüberblick in dem methodisch limi- 
tierten Rahmen (Bushman & Wang, 2009) und mit seinen vielen, durchaus 
heterogenen abhängigen Variablen zumindest in der Tendenz demonstriert, 
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dass es sich lohnt, den differenziellen, anscheinend durchaus komplementär 
wirkenden Effekten der Zieltextsorten nachzuspüren. 

Es wäre zu wünschen, dass eine Metaanalyse - zumal mit noch mehr Pri- 
märstudien - tatsächlich Effektstärken quantifiziert. Hinzu kommt, dass die 
vielen leeren Zellen aus der Tabelle 3 und der Tabelle 4 von weiteren Primär- 
studien gefüllt werden sollten (Primor & Katzir, 2018). Ähnliches gilt für gene- 
rell mehr Studien mit rezeptiven Maßen, für Studien, die die statistische Unab- 
hängigkeit von abhängigen Variablen nachweislich überprüfen, jüngere Alters- 
gruppen testen und nicht zuletzt für proximale und distale Einflussfaktoren auf 
Testleistungen in Verbindung mit experimentell variierten unabhängigen Va- 
riablen Ergebnisse berichten (Cromley, 2020). Als wichtiges Forschungsfeld in 
der ohnehin diesbezüglich stärker werdenden Leseforschung dürften die Auf- 
gabenmodelle selbst viele für die Theorieentwicklung und (Hoch-)Schulpraxis 
dringend nötige empirische Befunde beisteuern (List, Du & Wang, 2019; Phi- 
lippakos, 2018; Schoor et al., 2021). 
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